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Введение 


Эта книга посвящена описанию возможностей языка ассемблера процессоров 
Пие! Релцит. Книга не является учебником по языку ассемблера, хотя и может 
использоваться в этом качестве, — скорее это расширенное руководство по при- 
менению ассемблера процессоров ие] РепНит. Материал книги содержит много 
справочной информации по командам ассемблера и современным технологиям 
обработки данных. Изучение современного ассемблера — задача далеко не про- 
стая, и эта книга позволит читателю успешно ее решить. 

Язык ассемблера появился вместе с появлением процессоров и тесно связан 
с их архитектурой, позволяя напрямую обращаться к аппаратным ресурсам 
компьютера. Часто у читателей возникает вопрос: а зачем вообще нужно изучать 
язык ассемблера, когда имеются развитые средства программирования на языках 
высокого уровня, такие, например, как \У15иа| С++ МЕТ фирмы М!сгозой или 
Во[апа Реры 2005? Тем более что помимо этих средств есть еще целый спектр 
специализированных программных продуктов для разработки офисных прило- 
жений, баз данных, электронных таблиц и т. д. Подобные программы называют- 
ся средствами быстрой разработки и позволяют в считанные недели создавать 
самые сложные приложения. 

Тем не менее значение языка ассемблера трудно переоценить. Все без исклю- 
чения средства разработки программ в той или иной степени используют ассемб- 
лер. К примеру, большинство библиотечных функций языков С++ и Разса|, на ос- 
нове которых построены такие мощные инструменты разработки, как \У15иа! С++ 
и Реры, написаны на ассемблере. Мультимедийные приложения, программы об- 
работки сигналов и многие другие используют высокопроизводительные библиоте- 
ки функций, разработанные с помощью ассемблерных команд технологии $1МО. 
Наконец, если требуется, чтобы приложение работало максимально быстро и за- 
нимало меньше памяти (а это нужно для встроенных и мобильных систем в раз- 
личных отраслях промышленности), то применение ассемблера является едва ли 
не единственным способом достижения цели. По этой причине большинство 
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приложений, работающих в режиме реального времени, либо написаны целиком 
на ассемблере, либо используют в критических участках кода ассемблерный код. 

Даже по этим нескольким примерам видно, что язык ассемблера имеет свои 
сферы применения, свои ниши, которые никогда и ничем не будут заняты. Кроме 
того, как уже отмечалось, при разработке приложений на языках высокого уров- 
ня критические секции, требующие высокой скорости выполнения, пишутся на 
ассемблере. Именно поэтому в \У1зиа| С++ МЕТ и Реры 2005 имеется возмож- 
ность создавать программный код на встроенном ассемблере. Должен заметить, 
что фирма М!сгозой постоянно совершенствует встроенный ассемблер. 

Вряд ли кому-то придет в голову разрабатывать большие и многофункцио- 
нальные приложения на языке ассемблера, но ускорить производительность ра- 
боты таких приложений с помощью ассемблера можно. По сравнению с языками 
высокого уровня ассемблер обладает одним фундаментальным преимуществом, 
проистекающим из его природы, — он позволяет писать самый быстрый и ком- 
пактный код. Изучение языка ассемблера дает программисту одно очень важное 
преимущество — он глубже начинает понимать принципы работы приложений, 
написанных на любых языках, в том числе и на языках высокого уровня. Ассемб- 
лер очень помогает при разработке программ на языках высокого уровня, по- 
скольку знание низкоуровневого программирования позволяет выбирать опти- 
мальные решения. 

Что же касается инструментальных средств для разработки приложений на 
«чистом» ассемблере, то в последнее время появились очень мощные приложе- 
ния такого рода, что вынуждает по-другому взглянуть на проблему. Из таких ин- 
струментальных средств проектирования можно выделить в первую очередь мак- 
роассемблер МАЗМЗ2, а также Азт5и41о и МАЗМ. Эти и другие инструменты 
разработки программ имеют самый современный графический интерфейс. Не сле- 
дует забывать и о том, что для ассемблера разработаны многочисленные библио- 
теки функций, приближающие этот язык по своим функциональным возможно- 
стям к высокоуровневым средствам разработки приложений. 

Материал книги охватывает полный спектр архитектурно-программных ре- 
шений для процессоров Пе! Репиит, включая как базовую программную ар- 
хитектуру и набор основных команд ассемблера, так и современные технологии 
параллельной обработки данных ($1МО). Эта книга задумана как расширенный 
справочник по применению ассемблера в практических разработках, хотя может 
быть использована и как практическое пособие для программистов-разработчи- 
ков, желающих углубить свои знания о современных технологиях программиро- 
вания на ассемблере. 

Материал книги включает много примеров программного кода, в том числе 
и для технологий ЗТМО. Этими практическими примерами подкрепляются боль- 
шинство теоретических аспектов, рассматриваемых в книге. По мнению автора, 
такой путь является наиболее эффективным для изучения языка ассемблера. 

Все примеры программ являются полностью работоспособными и проверены 
автором. Они демонстрируют ключевые моменты использования тех или иных 
команд или технологий и реализованы в виде коротких процедур. Такая мето- 
дика выбрана сознательно, поскольку длинные и сложные программы обычно 
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запутывают читателя, и при их анализе легко теряются ключевые моменты, ради 
которых эти программы, собственно, и были разработаны. Любой пример неслож- 
но адаптировать для дальнейшего использования в собственных разработках. 

Для разработки примеров используется макроассемблер МАЗМ фирмы М!сго- 
50 с компилятором версии 7.10-хххх. Этот компилятор включен в состав У п- 
4о%5$ ХР ООК и \У/ш4до\з Зегуег 2003 РОК. Подойдет и компилятор версии 
6.14.хххх, но в этом случае примеры применения технологий $1МО компилиро- 
вать будет невозможно. В качестве среды разработки можно порекомендовать 
свободно распространяемый макроассемблер МАЗМЗ2 версии 8, который включа- 
ет в себя компилятор МТ, версии 6.14.хххх и компоновщик Г.ТМК версии 5.12.хххх 
фирмы Мггозой. 

Во всех примерах синтаксис языка ассемблера максимально упрощен, исполь- 
зуется минимум высокоуровневых конструкций языка. В книге не приводится 
детальное описание компилятора МАЗМ, а упоминаются лишь те сведения, кото- 
рые необходимы для работы. 

Книга рассчитана на широкий круг читателей — от начинающих программи- 
стов до опытных разработчиков. 


Структура книги 


Структура книги такова, что материал можно изучать выборочно по отдельным 

главам или последовательно, начиная с первой главы. Это позволяет различным 

категориям читателей изучать тот материал, который им более всего интересен. 
Книга состоит из 14 глав. 


® Глава 1, «Базовая архитектура процессоров Пие] х86». В этой главе рас- 
сматриваются базовая архитектура процессоров х86 фирмы Пие! и эволю- 
ция к последним моделям процессоров Пие! Реп ит. 


® Глава 2, «Основы создания приложений на языке ассемблера». Материал 
этой главы посвящен общим принципам создания программ на ассемблере. 
Здесь также рассмотрены основные этапы компиляции и компоновки при- 
ложений с использованием макроассемблера МАЗМ фирмы Мисгозой. 


» Глава 3, «Синтаксис языка ассемблера». В этой главе проанализирован 
синтаксис языка ассемблера, включая основные типы данных, модели па- 
мяти и типы адресации при работе с процессорами ие]. 


® Глава 4, «Структура программы на языке ассемблера». В этой главе проана- 
лизирована сегментная структура ассемблерных программ и ее взаимо- 
связь с используемыми моделями памяти. 


® Глава 5, «Организация вычислительных циклов». Материал главы посвя- 
щен организации вычислительных алгоритмов с использованием команд 
условных и безусловных переходов. Здесь также рассматриваются вариан- 
ты оптимизации ветвлений в программах с применением специальных ко- 
манд процессоров Пи! Репйит. 





12 Введение 


» Глава 6, «Процедуры на языке ассемблера». В этой главе описаны процесс 
разработки и применения процедур на языке ассемблера, а также вопросы 
организации и использования стека для передачи параметров. Рассмотре- 
ны различные варианты обработки данных в процедурах, обращений к ре- 
гистрам и памяти. 


® Глава 7, «Операции со строками и массивами». Здесь рассматриваются стро- 
ковые команды процессора те] Репиит и практические аспекты их при- 
менения при обработке символьных строк и числовых массивов. Проана- 
лизированы методы оптимизации строковых операций. 


® Глава 8, «Арифметические и логические операции». Материал главы по- 
священ анализу арифметических и логических команд процессора, а также 
преобразованиям целочисленных данных из одних форматов в другие. 


® Глава 9, «Использование математического сопроцессора». Здесь рассмат- 
риваются вопросы применения математического сопроцессора в операциях 
над числами с плавающей точкой и способы создания эффективных алго- 
ритмов обработки данных. 


®» Глава 10, «Интерфейс с языками высокого уровня». Материал главы по- 
священ применению отдельно скомпилированных ассемблерных модулей 
в программах на языках высокого уровня. В главе подробно анализируют- 
ся методы передачи параметров в процедуры и получения результатов. 


» Глава 11, «Процессоры те! Репйит в современных разработках». В гла- 
ве рассматриваются общие вопросы применения процессоров последних 
поколений ие! Репйит 4 в разработке высокоэффективных приложе- 
ний. Показаны возможности оптимизации приложений для процессоров 
Репиим 4. 


» Глава 12, «ММХ-расширение процессоров [те] РепНит». Здесь проанали- 
зированы основные аспекты использования технологии ММХ для повыше- 
ния производительности мультимедийных приложений и операций с це- 
лыми числами. 


® Глава 13, «33Е-расширение процессоров Пие! Репйит». В главе рассмат- 
риваются основные аспекты применения технологии $5Е для повышения 
производительности операций с плавающей точкой в коротком формате 
и возможности оптимизации программ. 


» Глава 14, «Технология 55Е2 в процессорах [пбе1 Репйит 4». Глава посвя- 
щена вопросам применения технологии $$Е2 для повышения производи- 
тельности операций с плавающей точкой двойной точности. Материал со- 
провождается многочисленными примерами практического применения 
данной технологии. | 

Материал книги дополнен справочником по системе команд процессоров пе] 


(Приложение А). Поскольку полная система команд насчитывает несколько 
сотен наименований, приведены только наиболее часто используемые команды. 
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Автор благодарит коллектив издательства «Питер» за помощь в подготовке 
книги к изданию. Особая признательность жене Юлии за поддержку и помощь 
в написании книги. 


От издательства 


Ваши замечания, предложения и вопросы отправляйте по адресу электронной 
почты: сотр@риег.сот (издательство «Питер», компьютерная редакция). 

Мы будем рады узнать ваше мнение! 

Все исходные тексты, приведенные в книге, вы можете найти по адресу И&р:// 
миииму. ржег.согл/домит!юаа. 

Подробную информацию о наших книгах вы найдете на веб-сайте издатель- 
ства: АЫр://мимим.р®ег.сот. 


Базовая архитектура 
процессоров Гп{| х86 





Успешное применение языка ассемблера невозможно без знания архитектуры 
процессоров [1п6е!. Процессоры [пе] в настоящее время доминируют на рынке, 
и многие архитектурные решения, на основе которых они построены, в той или 
иной степени используются и другими производителями процессоров. Посколь- 
ку все современные процессоры Пие| базируются на архитектуре 8086, то обычно 
говорят об архитектуре [пб] х86. 

Вкратце рассмотрим эволюцию процессоров фирмы Пие|. В 1979 г. фирма пе] 
первой выпустила 16-разрядный микропроцессор 8086, возможности которого 
были близки к возможностям процессоров мини-компьютеров 70-х годов. Микро- 
процессор 8086 стал базовым для целого семейства процессоров, которое называ- 
ют семейством 80х86 или х86. 

Чуть позже появился процессор 8088, архитектурно совместимый с процессо- 
ром 8086 и имеющий 16-разрядные регистры, но оперирующий с внешними дан- 
ными размером в 8 бит. В 1981 г. появились процессоры 80186/80188, наследую- 
щие базовую архитектуру процессоров 8086, но обладающие дополнительными 
возможностями. Это поколение включало дополнительные аппаратно-программ- 
ные компоненты: контроллер прямого доступа к памяти, счетчик/таймер и кон- 
троллер прерываний. Кроме того, система команд этих процессоров была рас- 
ширена. Несмотря на это, широкого распространения данные процессоры не 
получили. 

Следующим этапом в разработке новых идей стал процессор 80286. В этой мо- 
дели были использованы новые подходы, которые применялись в микрокомпью- 
терах и больших компьютерах. Процессор 80286 мог работать в двух режимах: 
в режиме реальных адресов (эмуляция процессора 8086) и в защищенном режиме 
виртуальных адресов (рго{есёе4 уптиа| а44гез$ то4е), который предоставлял но- 
вые возможности для программистов. В этом режиме можно было работать с рас- 
ширенным адресным пространством памяти размером в 16 Мбайт, также поддер- 
живались виртуальная память и мультизадачность. 
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Новый 32-разрядный процессор 80386 позволил успешно решить две основные 
задачи: он обеспечивал совместимость с предыдущими поколениями процессо- 
ров и одновременно повышал производительность выполнения программ. Совме- 
стимость с процессорами 8086 достигалась за счет включения в аппаратно-про- 
граммную архитектуру режима реальной адресации (геа] а44гез$ то4е). 

В этом режиме процессор 80386 мог выполнять 16-разрядный программный 
код процессора 80286 без каких-либо ограничений. В этом же режиме он мог 
запускать 32-разрядные программы, что повышало производительность системы. 
В 32-разрядном режиме были реализованы новые возможности процессора 80386: 
масштабированная индексная адресация памяти, ортогональное использование 
регистров общего назначения, новые команды и средства отладки. Адресное про- 
странство памяти позволяло работать с 4 Гбайт данных. 

По сравнению с предыдущими поколениями процессоров процессор 80386 
обеспечивал большее быстродействие (3-4 миллиона операций в секунду) и воз- 
можность работы со страничной виртуальной памятью. 

В 1989 г. фирма Пи! выпустила процессор 1486, содержащий более миллиона 
транзисторов в чипе. Являясь полностью программно совместимым с процессо- 
рами 386, он предоставлял новые возможности по обеспечению многозадачности 
систем и многоуровневого кэширования. Встроенная система тестирования по- 
зволяла проверять работоспособность аппаратной логики, кэш-памяти и аппа- 
ратного постраничного преобразования адресов памяти. Отладочные средства 
обеспечивали установку ловушек контрольных точек в исполняемом коде и во 
время доступа к данным. Процессор 1486 имел встроенный аппаратный кэш для 
хранения 8 Кбайт команд и данных, что увеличивало быстродействие системы, 
одновременно уменьшая степень использования процессором внешней шины. 

Следующим шагом в повышении производительности компьютерных сис- 
тем стало появление процессоров Пие! Репйит. По сравнению с процессором 
1486 был добавлен второй конвейер команд, что дало более высокую скорость 
выполнения команд. Оба конвейера команд, обозначаемые ц и у, при совместной 
работе обеспечивают выполнение двух инструкций процессора за один машин- 
НЫЙ ЦИКЛ. 

Размер встроенного кэша первого уровня увеличен в два раза, при этом для 
команд и данных используется по 8 Кбайт памяти. В процессоре применяются 
более эффективные по сравнению с 1486 алгоритмы прямой (\тКе-бгоиер) и об- 
ратной записи (\гие-БасК). 

В процессорах пе! Репйит впервые был использован так называемый ал- 
горитм прогнозирования программных ветвлений и циклов (БгапсВ ргед оп). 
С помощью такого алгоритма обеспечивается более эффективное управление пото- 
ком команд программы. Адреса прогнозируемых переходов хранятся в аппаратно 
реализованной таблице ветвлений. Кроме этого, в 1пе|! Репбит были внесены 
аппаратные расширения, позволяющие более эффективно работать в режиме 
виртуального процессора 8086 с адресным пространством в 4 Мбайт и размером 
страницы 4 Кбайт. 

Основные регистры процессора остались 32-разрядными, но были добавлены 
внутренние шины передачи данных размерностью в 128 и 256 бит, что обеспечивает 
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более быстрый обмен данными внутри процессора. Кроме того, внешняя шина 
данных в процессоре позволяет работать с 64-разрядными данными. 

В процессоре пе! РепНит сочетаются высокая производительность, совме- 
стимость, интеграция данных и наращиваемость. Это достигается за счет того, 
что процессор обладает: 


® суперскалярной архитектурой; 

® раздельным кэшированием программного кода и данных; 

® блоком прогнозирования адреса перехода; 

® высокопроизводительным блоком операций с плавающей точкой; 

® расширенной 64-разрядной шиной данных; 

® поддержкой многопроцессорного режима работы; 

® средствами задания размера страницы памяти; 

» средствами обнаружения ошибок и функциональной избыточности; 
® возможностями для управления производительностью. 


Совместимая только с Пе] суперскалярная двухконвейерная промышленная 
архитектура процессора тие] Репбит позволяет ему достичь нового уровня про- 
изводительности посредством выполнения более чем одной команды за один 
такт. Термин «суперскалярная» обозначает процессорную архитектуру, которая 
содержит более одного вычислительного блока. Все эти вычислительные блоки, 
или конвейеры, являются узлами, где происходят все основные процессы обра- 
ботки данных и команд. Они позволяют выполнить значительно большее число 
команд за одно и то же процессорное время по сравнению с предыдущими поко- 
лениями процессоров. 

Появление суперскалярной архитектуры процессора тие] Репиит представ- 
ляет собой естественное развитие предыдущего семейства процессоров с 32-раз- 
рядной архитектурой фирмы Пие|. Например, процессор 1486 способен выпол- 
нять несколько своих команд за один такт, в то время как предыдущие семейства 
процессоров фирмы Пие] требовали множества циклов тактовой частоты для вы- 
полнения одной команды. 

Другим важным усовершенствованием, реализованным в процессорах Реп ит, 
является раздельное кэширование. Кэширование повышает производительность 
посредством активизации места временного хранения часто используемых про- 
граммного кода и данных, получаемых из быстрой памяти, заменяя по возможно- 
сти обращение к внешней системной памяти для некоторых команд. 

Раздельное кэширование позволяет выполнять несколько команд одновремен- 
но. Кэш-память программного кода и данных процессора Репйит содержит по 
8 Кбайт информации и организована как набор двухканального ассоциативного 
кэща. Такая кэш-память предназначена для записи только предварительно про- 
смотренного 32-байтового сегмента, причем работает быстрее, чем внешний кэш. 
Все это потребовало использования 64-разрядной внутренней шины данных, 
которая обеспечивает возможность двойного кэширования и суперскалярной 
конвейерной обработки одновременно с загрузкой последующих данных. 
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Кэш данных имеет два интерфейса, по одному для каждого из конвейеров, что 
позволяет ему обеспечивать данными две отдельные инструкции в течение одно- 
го машинного цикла. После того как данные извлекаются из кэша, они записыва- 
ются в основную память в режиме обратной записи. Подобная техника кэширо- 
вания дает лучшую производительность по сравнению с простым кэшированием 
с непосредственной записью, при котором процессор записывает данные одновре- 
менно в кэш и в основную память. Тем не менее процессор ве! Репиит способен 
динамически конфигурироваться для поддержки кэширования с непосредствен- 
ной записью. 

Блок прогнозирования адреса перехода позволяет повысить производитель- 
ность, предварительно определив правильный набор выполняемых команд и пол- 
ностью заполнив ими конвейеры. 

Процессор п Репиит дает возможность выполнять математические вы- 
числения на более высоком уровне благодаря использованию усовершенствован- 
ного встроенного блока операций с плавающей точкой, который включает в себя 
8-тактовый конвейер и аппаратную реализацию основных математических функ- 
ций. 4-тактовые конвейерные команды для операций с плавающей точкой до- 
полняют 4-тактовую целочисленную конвейеризацию. Большая часть команд, 
оперирующих данными с плавающей точкой, может выполняться в одном цело- 
численном конвейере, после чего помещается в конвейер операций с плавающей 
точкой. Обычные операции с плавающей точкой, такие, как сложение, умножение 
и деление, реализованы аппаратно для ускорения процесса вычислений. 

В результате этих усовершенствований процессор ие] РепИит выполняет 
команды для операций с плавающей точкой в пять раз быстрее, чем работающий 
на частоте 33 МГц процессор 1486, оптимизируя их для высокоскоростных вы- 
числений в мультимедийных приложениях, а также в З)- и САО/САМ-прило- 
жениях. 

К числу аппаратных нововведений следует отнести и более совершенный про- 
граммируемый контроллер прерываний (Адуапсе4 РгоегаттаЫе [тиеггире Сопс- 
гоЦег, АРТС), позволяющий создавать системы с несколькими процессорами [шее] 
Репиит. Но самым радикальным усовершенствованием процессоров Ге! Репиит 
стало внедрение технологии ММХ (МшШИМе41а еХепз!0п$ — мультимедийные 
расширения). В технологии ММХ для организации параллельных вычислений 
над упакованными 64-разрядными целыми числами используется модель $ МО 
(ше шугисйоп, МШаре Раба — одна команда, много данных). Параллельная 
обработка целочисленных данных не требует дополнительных регистров про- 
цессора — задействуются регистры математического сопроцессора. Технология 
ММХ позволила существенно повысить производительность мультимедийных 
приложений, программ обработки звука и изображений, программ криптографии 
и сжатия данных. 

Для аппаратуры компьютера процессор [те]! Репиит представляет собой 
32-разрядное устройство. Внешняя шина данных к памяти является 64-разряд- 
ной, что обеспечивает передачу удвоенного объема данных за один цикл шины. 
Процессор поддерживает несколько типов циклов, включая цикл пакетного ре- 
жима, в течение которого в кэш данных передается 256-разрядный пакет данных. 
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Шина данных является главной магистралью, которая передает информацию 
между процессором и подсистемой памяти. Благодаря 64-разрядной шине дан- 
ных процессор те] Репиит существенно повысил скорость передачи — до 
528 Мбайт/с для 66 МГц по сравнению со 160 Мбайт/с для 50 МГц процессора 
1486. Эта расширенная шина данных поддерживает высокоскоростные вычисле- 
ния за счет одновременной загрузки командами и данными процессорного блока, 
благодаря чему достигается еще большая общая производительность процессора 
ие! Репиит по сравнению с процессором 1486. 

Первые модели процессора пе! Репйит работали на частоте 60 и 66 МГц и об- 
менивались данными с внешней кэш-памятью второго уровня по 64-разрядной 
шине данных, работающей на тактовой частоте процессорного ядра. Однако здесь 
есть некоторые сложности. При возрастании скорости процессора [пе]! Репцит 
все сложнее становится и дороже обходится его согласование с электронным 
интерфейсом на материнской плате. 

По этой причине быстрые процессоры Пие] РепИиит используют делитель 
частоты для синхронизации внешней шины путем задания меньшей частоты. На- 
пример, у процессора ие! РепНит с частотой 100 МГц внешняя шина работает 
на частоте 66 МГц, а у процессора с частотой 90 МГц -- на частоте 60 МГц. Про- 
цессор задействует одну и ту же шину для доступа к основной памяти и к пери- 
ферийным подсистемам, таким, как шина РС]. 

Дальнейшим усовершенствованием процессоров [пе] Репйит стала модель Рб, 
выпущенная в 1995 г. Это поколение процессоров базировалось на суперскаляр- 
ной архитектуре, что позволило без перехода на другую технологию изготовле- 
ния кристалла значительно повысить производительность. Первым процессором 
семейства Рб стал Пие] РепЧит Рго. Далее были разработаны более совершенные 
процессоры этой линейки, известные как [те] Репйит И, Пие! РепИит П Хеоп, 
ие! Сеегоп, тие! Репёит Ш и Ге! Репнит Ш Хеоп. 

Появление процессора РепНит Рго ознаменовало собой значительный шаг 
вперед по сравнению с ие! Репнит. Несмотря на то что в процессоре пе] Репйит 
впервые была реализована суперскалярная форма архитектуры х86, она имела 
определенные ограничения. В этой архитектуре имеется всего два целочислен- 
ных конвейера, которые могут обрабатывать две команды параллельно, но только 
если они следуют друг за другом — здесь отсутствует алгоритм, позволяющий 
предсказывать ветвления в программе. 

В процессоре РепнНит Рго реализована новая модель суперскалярной архи- 
тектуры, позволяющая одновременно выполнять пять команд. Внедрение такой 
архитектуры позволило достичь высокой пропускной способности, но одновре- 
менно потребовало значительного улучшения схемы кэширования. По сравнению 
с обычным процессором Ге]! Репцит, в Репйит Рго пришлось расширить файл 
регистров, повысить глубину очереди упреждающей выборки и условного выполне- 
ния команд, усовершенствовать алгоритм прогнозирования адресов перехода и реа- 
лизовать обработку данных не в порядке их поступления, а по мере их готовности. 

Суперскалярная архитектура процессора Репиит Рго позволяет выполнять 
максимум три машинные команды в течение одного цикла. Кроме того, в процессо- 
ре используется концепция динамического выполнения команд (изменение по- 
рядка выполнения команд, улучшенный алгоритм прогнозирования ветвлений 
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и опережающего выполнения команд). Суперскалярная архитектура реализована 
с помощью трех блоков декодирования команд, работающих параллельно. Ко- 
манды разбиваются на так называемые микрооперации, которые выполняются 
параллельно в пяти исполнительных модулях: двух целочисленных, двух ЕРО 
(Еюачпв-Роше Оп) и одном модуле интерфейса памяти. 

В программно-аппаратную архитектуру процессора входит и специальный 
модуль отложенных операций (теНгетепе ип), позволяющий выполнять после- 
довательность микроопераций в нужном порядке даже при наличии ветвлений. 

По сравнению с процессором Пие] Репии, в Репиит Рго был увеличен раз- 
мер кэша второго уровня (2"ч-[еуе] сасЬе) до 256 Кбайт. Процессор Репбит Рго 
имеет 36-разрядную адресную шину, позволяющую расширить пространство фи- 
зических адресов до 64 Гбайт. 

В процессоры Репбит Рго встроена вторичная кэш-память, соединенная с цен- 
тральным процессором отдельной шиной. Эта кэш-память, представляющая со- 
бой статическое ($$айс) оперативное запоминающее устройство (Кап4от Ассезз 
Метогу, ВАМ) емкостью 256 или 512 Кбайт, значительно повышает производи- 
тельность вычислительных систем на основе Репиит Рго. 

В процессоры 1л(е! Репиит П семейства Рб была включена поддержка техно- 
логии ММХ. Что касается процессоров Репиит П Хеоп, то в них были скон- 
центрированы все преимущества предыдущих поколений процессоров [пе]. Это 
поколение процессоров было разработано с 4- и 8-кратной масштабируемостью, 
а также с кэшем второго уровня, имеющим размер 2 Мбайт. Этот процессор 
предназначается в основном для высокопроизводительных серверов и рабочих 
станций. 

Еще один представитель линейки — процессор [те] Се]егоп — базируется 
на архитектуре 1А-32 и предназначен для применения в настольных компьюте- 
рах. К особенностям этого процессора следует отнести наличие встроенного кэша 
второго уровня размером 128 Кбайт, а также низкую стоимость. 

Значительный шаг вперед был сделан при разработке процессора Пие] Репи- 
ит Ш, в котором была реализована технология 55Е (З6геапипя ЗПМО Ежепзюоп$ — 
потоковые $ МО-расширения). Эта технология является дальнейшим развитием 
технологии ММХ. В ней используются 128-разрядные регистры для выполнения 
параллельных операций с упакованными числами с плавающей точкой. Кроме 
того, в процессорах Репиит Ш Хеоп для повышения производительности имеет- 
ся улучшенный кэш передачи данных (адуапсе4 {гапзЕег сасВе). 

Процессор лее] Репит 4 является последним в линейке процессоров фирмы 
Пие|, базирующихся на архитектуре ГА-32, причем здесь была использована мик- 
роархитектура М№еВиг$. В основе этой микроархитектуры лежит оригинальная 
разработка [пе], позволяющая процессору функционировать на более высокой 
тактовой частоте, что значительно повышает производительность Репбит 4 по 
сравнению с предыдущими поколениями процессоров. Микроархитектура Ме Виг 
имеет следующие особенности: 


» улучшенное схемотехническое и конструктивное исполнение, обеспечиваю- 
щее высокую производительность операций (гар! ехесиНоп епше); 


®« поддержка технологии Нурег РреЙпед; 
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поддержка технологии Адуапсед Оупапис ЕхесиНоп; 
принципиально новая система кэширования команд-данных; 


поддержка технологии 55Е2 (5$геапиая $1МО Ежепзюпз 2), которая обес- 
печивает расширение возможностей технологий ММХ и $5Е фирмы Пие] 
за счет включения в систему команд 128-разрядной целочисленной ариф- 
метики и 128-разрядной арифметики чисел с плавающей точкой двойной 
точности; | 


гибкая система управления кэшированием данных и памятью. 


Аппаратно микроархитектура Ме ВигзЕ реализована в виде быстродействую- 
щей (400 МГц) системной шины, обладающей впечатляющими возможностями 
по обработке данных: 


производительность операций — до 3,2 Гбайт/с, что более чем в 3 раза пре- 
вышает производительность Репйит Ш; 


тактовая частота шины — 100 МГц с возможностью учетверения скорости 
(400 МГц); 


высокая степень конвейеризации транзакций; 


возможность доступа к 128-разрядным данным посредством 64-разрядных 
элементов; 


совместимость с существующим программным обеспечением и операцион- 
ными системами, разработанными для архитектуры !А-32. 


Основы создания 
приложений 
на языке ассемблера 





Материал этой главы посвящен основам создания программ на языке ассемблера, 
известном также как язык символического кодирования. Язык ассемблера явля- 
ется одним из самых сложных, поскольку требует знания аппаратно-программ- 
ной архитектуры процессора и особенностей его функционирования. Сложная 
внутренняя структура, разнообразные форматы команд, многочисленные режимы 
адресации процессоров [ие] х86 ограничивают возможности разработки слож- 
ных и объемных программ на языке ассемблера. 

Если же требуется разработать небольшое быстрое приложение, потребляю- 
щее мало ресурсов, то язык ассемблера является очень серьезной альтернативой 
языкам высокого уровня. Кроме того, в любых сложных программах всегда суще- 
ствуют критические секции, требующие интенсивных и быстрых вычислений, 
которые придется разрабатывать не на языке высокого уровня, а на ассемблере. 

Для разработки программ на ассемблере создана масса инструментальных 
средств, но мы будем использовать макроассемблер МА$М фирмы М!сгозой, 
включающий в себя несколько утилит. Выбор макроассемблера МАЗМ в качест- 
ве среды разработки сделан исходя из следующих соображений: 


® МАЗМ является наиболее популярной средой программирования на ас- 
семблере; 


® последние версии макроассемблера МАЗМ (7.10-хххх) позволяют работать 
с мультимедийными расширениями (51МО), которые поддерживаются по- 
следними поколениями процессоров. Это является очень важным факто- 
ром, поскольку очень мало компиляторов ассемблера поддерживают эти 
технологии; | 


® соглашения и форматы файлов, принятые в МАЗМ, поддерживаются боль- 
шинством компиляторов языка ассемблера; 
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® стандарты и соглашения, принятые в МАЗМ, полностью совместимы с те- 
ми, что приняты в наиболее популярных средах разработки (М1сгозоЁ 
\У15ща| С++ МЕТ и ВоНап4 Ое!рН: 2005). Это свойство позволяет включать 
скомпилированные макроассемблером объектные файлы в программы, 
разработанные на языках высокого уровня, 


Популярный компилятор ТА$М, к сожалению, более не поддерживается, и его 
развитие закончилось несколько лет назад. Серьезным недостатком этого компи- 
лятора при всей его привлекательности является невозможность работы с совре- 
менными архитектурами процессоров [пе], поддерживающими технологии па- 
раллельной обработки данных ($1МО). 

Хочу уточнить, что мы будем создавать и анализировать программы и проце- 
дуры с использованием компилятора ассемблера версий не ниже 6.14.-хххх, а при 
рассмотрении технологий $1МО —не ниже 7.10.хххх. Очень удобен для этих це- 
лей свободно распространяемый пакет программ МАЗМЗ2, содержащий помимо 
компилятора версии 6.14 также редактор исходных текстов и несколько полез- 
ных утилит. На момент написания книги текущей версией МАЗМЗ2 является 8.2. 

Рассмотрим более подробно процесс ассемблирования программ с помощью 
макроассемблера МАЗМ. Должен заметить, что ассемблирование программ прак- 
тически не различается для версий 6.14хллх и выше. 

Пакет МАЗМ фирмы М1сгозой включает в себя основные программы, необхо- 
димые для создания, отладки и сопровождения программ на языке ассемблера. 
Процесс создания и выполнения программ на языке ассемблера состоит из двух 
шагов: 


1. Ассемблирование (аззетЬ тв) исходного текста программы в объектный 
файл. Файл, содержащий исходный текст программы на ассемблере, имеет 
расширение АЗМ, а получаемый в результате ассемблирования объектный 
файл — расширение ОВ3. 


2. Компоновка полученного объектного файла вместе с другими объектными 
файлами и/или библиотеками в исполняемый файл (с расширением ЕХЕ). 


Ассемблирование исходного текста выполняет утилита п\.ехе, входящая в со- 
став макроассемблера, а сборку всей программы — утилита йпК.ехе. Эти утилиты 
могут как выполняться из командной строки, так и включаться в состав про- 
граммных сценариев. Как п1|, так и ЦпК принимают множество параметров, часть 
из которых рассматривается далее. 

В состав макроассемблера включен ряд других очень полезных программ, но 
мы сосредоточим внимание только на утилитах т] и ПпК, поскольку именно они 
будут использованы при разработке программ и процедур в этой книге. Читате- 
ли, заинтересованные в более глубоком изучении возможностей макроассембле- 
ра МАЗМ, легко обнаружат полные описания всех программ пакета в Интернете. 

После того как исходный текст ассемблерной программы разработан, можно 
указать специальные условия для его ассемблирования при помощи директивы 
ОРТТОМ. Эта директива имеет несколько параметров, позволяющих управлять про- 
цессом ассемблирования программы. 

Проанализируем более подробно каждый из этапов создания программ на 
языке ассемблера. 
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2.1. Ассемблирование исходного текста 


Программа п.ехе выполняет два последовательных действия при создании ис- 
полняемого файла программы. Во-первых, она обеспечивает трансляцию исход- 
ного текста программы в промежуточный объектный файл. Во-вторых, п[.ехе 
вызывает программу ИпК.ехе, которая компонует объектные файлы и библиотеки 
в единую выполняемую программу. 

В процессе трансляции исходного текста программы выполняются следующие 
действия: 

1. Анализируются директивы условного ассемблирования, и в случае истин- 

ности указанных в них условий выполняются те или иные шаги. 


2. Разворачиваются макросы. 


3. Вычисляются константные выражения, такие, например, как пудафа апа 101, 
при этом выражения замещаются вычисленными значениями. 


_ 4. Декодируются команды и операнды, не находящиеся в памяти. Например, 
на этом шаге будет декодирована команда поу АХ. 10, поскольку она не име- 
ет операндов, расположенных в памяти. 


5. Сохраняются смещения переменных в памяти как смещения относительно 
сегментов, в которых эти переменные расположены. 


Сегменты и их атрибуты размещаются в объектном файле. 
В объектном файле сохраняются перемещаемые адреса (геосаса е а44геззез). 
При необходимости создается файл листинга. 


Непосредственно программе тК.ехе передаются некоторые директивы (на- 
пример, 1МСШШОЕНВ и 005$Еб). 


Директивы условного ассемблирования более подробно описаны в руководстве 
по макроассемблеру МАЗМ 6.14 фирмы М!сгозой. 


оно 


2.2. Компоновка программ 


После успешной трансляции исходного текста ассемблерной программы резуль- 
тат в виде объектного файла передается компоновщику йпК.ехе. Компоновщик 
может связать несколько объектных файлов в один исполняемый ЕХЕ-файл. 
При этом все сегменты, определенные в программе, группируются в соответствии 
с инструкциями, содержащимися в объектном файле. Вся информация о разме- 
щении сегментов записывается в заголовок исполняемого файла. 

Здесь следует упомянуть о том, что структура программы (не только на ас- 
семблере) определяется несколькими факторами: 


® архитектурой процессора; 


® особенностями той операционной системы, под управлением которой эта 
программа будет выполняться; 


®» правилами работы выбранного компилятора — разные компиляторы предъ- 
являют разные требования к исходному тексту программы. 
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Например, исходный текст простой 16-разрядной программы, выводящей стро- 
ку $4г на экран в операционной системе М5-ОО5, может выглядеть так: | 
аз$ите С5$:соде. 05$:дафа 
софе зедтеп® 
збаге: 
оу АХ. Чата 
пюу 0$. АХ 
поу АН. 09 
тоу 0Х. оРР5еф $%г 
1 218 
оу АХ. 40001 
1 21 
соде епд$ 
Чака зедтепе 
5г ОВ "Тез $г1п9$” 
дафа епд$ 
еп@  $агё 


Эта программа выполняется только в операционной системе М$-ОО$ и не 
работает в таких операционных системах, как \/Л/п4о\з 2000 и УЛп4о\з ХР, по- 
скольку структура исполняемого файла не соответствует требованиям, выдвигае- 
мым этими операционными системами. Чтобы программа могла вывести строку 
на экран, например, в \Подо\з ХР, требуется кардинальным образом изменить 
структуру программы. 

Кроме этого, программы для операционных систем М5-РО$ и \/1п4до\%з тре- 
буют задания различных параметров компилятора и компоновщика, что вызвано 
различной организацией операционных систем М5-РО$ и УЛп4о\з. Операци- 
онная система М5-ОО$ использует 16-разрядную модель памяти в реальном ре- 
жиме, в то время как \/14о\5 ХР, например, 32-разрядный защищенный режим 
с линейной адресацией памяти. Далее мы проанализируем основные параметры 
компилятора п1.ехе и компоновщика йпК.ехе макроассемблера МАЗМ для созда- 
ния различных типов приложений. , 

Трансляцию файлов с расширением АЗМ можно выполнить из командной 
строки: 

М1 /с /со#Р имя файла ат 


Созданный при помощи этой команды объектный файл имеет формат СОЕЕ. 
Если параметр /со1Т не задан, то форматом созданного объектного файла бу- 
дет ОМЕ. 

Компоновщик йпК.ехе оперирует с ОВ]-файлами как в формате СОЕЕ, так 
и в формате ОМЕ, при этом выполняется автоматическое преобразование формата 
файла из ОМЕ в СОЕЕ. Обычно при генерации исполняемых файлов использу- 
ется формат СОЕЕ. Кроме того, и это очень важно, если файл объектного модуля 
должен применяться в приложении, написанном на \151а| С++ МЕТ, то формат 
его обязательно должен быть СОЕЕ. В то же время при применении объектного 
файла в приложении, разработанном в Во|ап4 Реры 2005, единственным вос- 
принимаемым форматом является ОМЕ. 
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Для того чтобы из объектного файла создать исполняемый файл, работающий 
в М5-0ОО$5, следует выполнить командную строку 


19иК /со имя_файла.06} 


Здесь следует учитывать то, что версия компоновщика пК.ехе должна поддер- 
живать генерацию 16-разрядных приложений М$-ОО$5. Использование 32-раз- 
рядных компоновщиков приведет к ошибке создания ЕХЕ-файла. 

Для генерирования 32-разрядных ЕХЕ-файлов следует использовать коррект- 
ную версию компоновщика, при этом командная строка должна выглядеть так: 


Т1ик /ЗИВЗУЗТЕМ:МТМО0$ /ОРТ:МОВЕЕ имя файла. 063 


Приведенных здесь сведений вполне достаточно для компиляции исходных 
текстов ассемблерных программ и процедур, представленных в книге. Более под- 
робная информация о пакете МАЗМ доступна в Интернете, а также в многочис- 
ленных литературных источниках. 

В последующих главах мы рассмотрим структуру данных и синтаксис команд 
макроассемблера МАЗМ. 


Синтаксис языка 
ассемблера 





Язык ассемблера, называемый также языком символического кодирования, пред- 
ставляет собой машинный язык в символической форме, которая более понятна 
и удобна программисту. Сложная внутренняя структура, разнообразные форма- 
ты команд, многочисленные режимы адресации процессоров [пе] ограничивают 
возможности разработки сложных и объемных программ на языке ассемблера. 
Однако в любых сложных программах всегда существуют критические секции, 
требующие интенсивных и быстрых вычислений, которые приходится разраба- 
тывать не на языке высокого уровня, а на ассемблере. 

Разработка программ на языке ассемблера требует хороших знаний архитек- 
туры всей системы, включая режимы адресации данных, структуры памяти и си- 
стемы команд процессора. Поэтому анализ возможностей ассемблера мы будем 
проводить в тесной взаимосвязи с архитектурой процессоров Пе! Репиит. 
Напомню, что мы рассматриваем язык ассемблера, основанный на разработке 
фирмы М!сгозой версии 6.14 и выше. Он включает в себя множество параметров, 
команд и директив, анализ которых займет много времени. Поэтому здесь будут 
рассмотрены только наиболее важные языковые конструкции, без знания кото- 
рых создавать программы невозможно. Для такого анализа нужно четко пони- 
мать, как данные представляются в компьютере и каковы общие принципы их 
обработки, поэтому начнем именно с этого. 


3.1. Представление данных в компьютере 


В основе работы компьютера лежат понятия бита и байта — именно они представля- 
ют данные и команды в памяти. Минимальной единицей информации в компьюте- 
ре является бит. Бит может принимать одно из двух значений: 0 или 1 — и является 
составным элементом для более информативных единиц данных. Минимальный 
объем информации, к которому имеется доступ в памяти компьютера, составляет 
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один байт (8 двоичных разрядов, или битов), при этом говорят о байтовой орга- 
низации памяти (хотя теоретически память может быть организована и по-дру- 
гому). Все байты оперативной памяти нумеруются начиная с нуля. Местополо- 
жение каждого байта в памяти характеризуется его номером или, по-другому, 
адресом. Схематически байт представляет собой структуру данных, изображен- 
ную на рис. 3.1. 


76543210 


Рис. 3.1. Представление байта 


Старший бит байта имеет номер 7, младший — 0. В оперативной памяти маши- 
ны байты данных располагаются по возрастанию адресов (рис. 3.2). 


Старшие адреса памяти 





Младшие адреса памяти 
Рис. 3.2. Адресация памяти 


Исключение составляет специальная область памяти, называемая стеком, — 
в ней байты данных располагаются в сторону убывания адресов. Более подробно 
мы рассмотрим стек в последующих главах. 

Редко случается так, что для представления данных требуется один байт. 
Во многих случаях данные нужно представить большим числом байтов. Если 
данные можно представить двумя байтами, то говорят, что они представлены 
словом. О данных, требующих для представления 4 байта, говорят, что они 
имеют размерность двойного слова. Наконец, данные могут быть представлены 
восемью (учетверенное слово) или шестнадцатью (двойное учетверенное слово) 
байтами. Во всех этих случаях расположение байтов соответствует правилу: 
младший байт располагается по младшему адресу, а старший байт — по стар- 
шему (рис. 3.3). 

Нумерация байтов в обычных, двойных и учетверенных словах начинается 
с младшего (нулевого) байта и заканчивается 1, Зи 7-м байтом соответственно. 
В документации часто используется такой способ расположения байтов, когда 
старшие байты располагаются слева, а младшие — справа. Пример такого распо- 
ложения байтов в двойном слове показан на рис. 3.4. 
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Старшие адреса памяти 


Двойное слово 
Младшие адреса памяти 





Рис. 3.3. Представление данных различной размерности в памяти 


Крайний слева байт принято называть старшим, а крайний справа — млад- 
шим. Такой порядок расположения байтов связан с обычной для нас формой 
записи чисел, когда в многоразрядном числе слева находятся старшие разряды, 
а справа — младшие. Следующее число опять начнется со старшего разряда и за- 
кончится младшим. Однако в памяти компьютера данные располагаются в более 
естественном порядке непрерывного возрастания номеров байтов, и, таким обра- 
зом, каждое слово или двойное слово в памяти начинается с младшего байта и за- 
канчивается старшим (см. рис. 3.4). 


О О НН ПОНИ 


3-й (старший) байт 2-й байт 1-й байт 0-й (младший) байт 
Рис. 3.4. Расположение байтов двойного слова 


Вкратце напомню, как интерпретируются числовые данные в компьютере. Ком- 
бинируя двоичные цифры (биты), можно представить любое числовое значение. 
Значение двоичного числа.определяется относительной позицией каждого бита 
и наличием единичных битов. Рассмотрим восьмибитовое число (байт), пред- 
ставленное следующим образом: 


10100101 


Поскольку мы имеем дело с двоичной системой счисления, то это число мож- 
но представить так: 


1х 27 + 0х 26 + 1х 25 + 0х 24 + 0х 23 + 1х 22 + 0х 21 + 1х 20, 


Значение этого числа в десятичной системе равно 165. Таким образом, любое 
двоичное число, имеющее п разрядов, можно представить в виде 


вх 2-1 + фх. 2-2 +... 4х 20, 
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Здесь А может принимать одно из двух значений: 0 или 1. Разрядность п двоич- 
ного числа определяется архитектурой системы и обычно кратна восьми. Сразу 
замечу, что мы рассматриваем двоичное представление целых чисел, являющееся 
базисом для понимания вычислительных операций с любыми другими типами 
чисел, такими, например, как вещественные числа или, в терминологии ассембле- 
ра, «числа с плавающей точкой». 

В арифметических операциях задействованы положительные и отрицатель- 
ные целые и вещественные числа, поэтому необходимо каким-то образом раз- 
личать их знаки. Знак двоичного числа указывается старшим или, как его назы- 
вают, знаковым битом числа. Положительные числа имеют в старшем разряде 
нулевой бит, а отрицательные. числа — единичный. Отрицательные двоичные 
числа выражаются двоичным дополнением, то есть для представления отрица- 
тельного двоичного числа необходимо инвертировать все его биты и к результату 
прибавить 1. 

В следующем примере находится двоичное представление числа —61. Поло- 
жительное число 61 представляется как 00111101, а процесс преобразования по- 
казан далее: 

11000010 (инверсия числа 61) 


+ 
00000001 


11000011 (—61) 


Несколько слов об операции сложения. Она выполняется по простым прави- 
лам: 


0+0=0 

1+0=1 

0+1=1 

1+1=0+1 (бит переноса) 

Как и в десятичной системе счисления, при выходе за пределы разрядной сет- 


ки для данного разряда образуется единица переноса в следующий разряд. Это 
продемонстрировано на рис. 3.5. 





переноса 
Рис. 3.5. Схема сложения двоичных чисел с переносом 
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Проверить результат преобразования положительного числа в отрицательное 
очень просто: достаточно сложить оба числа, при этом результат должен быть 
нулевым. Например, если сложить числа 61 и —61, должен получиться 0: 


00111101 (61) 
+ 
11000011 (-61) 


00000000 


Результат получился нулевым, что свидетельствует о корректности преобра- 
зования. Перенос из самого старшего разряда при этом теряется. 

Вычитание двоичных чисел выполняется как модифицированный вариант 
сложения, при этом вначале инвертируется знак вычитаемого, после чего чис- 
ла складываются. Это обусловлено тем, что операционный блок процессора 
содержит только устройства сложения (сумматоры) и не имеет устройств вы- 
читания. 

Приведу простой пример. Пусть требуется из числа 5 вычесть 2. Эту опера- 
цию можно представить как 5 + (-2). Число 5 представляется в двоичной фор- 
ме как 00000101, а число —2 — как 11111110. Результат вычисляется следующим 
образом: 


00000101 (5) 
+ 
11111110 (-2) 


00000011 (3) 


Здесь я хочу сделать важное замечание. Процессор ничего не «знает» о знако- 
вых и беззнаковых числах, он просто складывает биты операндов, поэтому вся от- 
ветственность за интерпретацию результатов ложится на прикладные программы. 
Операции умножения и деления алгоритмически более сложны, но в их основе 
также лежат операции сложения и вычитания. 

Представление двоичных чисел в виде последовательности нулей и единиц 
часто бывает не очень удобным из-за своей громоздкости и не очень хорошей чита- 
бельности. Во многих случаях используется так называемое шестнадцатеричное 
представление чисел. Такая система счисления включает символы от 0 до Ри, по- 
скольку таких символов 16, называется шестнадцатеричной. Шестнадцатерич- 
ный формат нашел широкое применение в языке ассемблера. В ассемблерных 
листингах программ в шестнадцатеричном формате показаны все адреса, машин- 
ные коды команд и содержимое констант. Отладочная информация также выда- 
ется в шестнадцатеричном формате. 

В табл. 3.1 приведены десятичные, двоичные и шестнадцатеричные значения 
чисел от 0 до 15. . 

Если немного поработать с шестнадцатеричным форматом, то можно быстро 
к нему привыкнуть. 
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Таблица 3.1. Соответствие между десятичными, двоичными и шестнадцатеричными числами 


Десятичное число Двоичное число Шестнадцатеричное число 
0 0000 0 

1 0001 1 

2 0010 2 

3 0011 3 

4 0100 4 

5 0101 5 

6 0110 6 

7 0111 7 

8 1000 8 

9 1001 9 

10 1010 А (а) 
11 1011 В (5) 
12 1100 С (©) 
13 1101 о (9) 
14 1110 Е (е) 
15 1111 Е(9 


Для того чтобы различать форматы чисел, в языке ассемблера приняты специ- 
альные обозначения: В, Ь — двоичные числа; Н, В — шестнадцатеричные числа. 
Приведу несколько примеров чисел в разных форматах: 


56 = 00111000Ъ = 38 
—13 = 11110101 = Е5Ъ 


Сложение и вычитание чисел в шестнадцатеричном формате осуществляется 
по тем же правилам, что и двоичных или десятичных чисел: операция выполня- 
ется для каждого разряда с учетом переноса из младшего разряда или заема из 
старшего. Рассмотрим несколько примеров. 

Пусть требуется сложить два числа в шестнадцатеричном формате: ЗЕВ и 27В: 


ЗЕ 


66 


При сложении младших разрядов, равных Е и 7, результирующее значение 
равно 22 (в десятичной системе), то есть младший разряд будет равен 22 - 16 = 6, 
при этом происходит перенос в старший разряд. При сложении старших разрядов 
результирующее значение вычисляется как 3 + 2 + бит переноса, то есть оконча- 
тельный результат равен 66}. 
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‚ В следующем примере необходимо вычесть шестнадцатеричное значение 7ЕЬ 
из ААЙ: 


АА 


2С 


При вычитании младших разрядов, равных А (10 в десятичной системе) и Е 
(14 в десятичной системе), необходим заем из старших разрядов. Тогда значение 
младшего разряда будет равно 16 + 10 - 14 = 12 или в шестнадцатеричной фор- 
ме — С. Результат вычитания старших разрядов будет равен 9 - 7 = 2. Оконча- 
тельный результат вычитания равен 2СВ. 

Двоичные числа используются не только в вычислениях, но и для другой функ- 
ции — с их помощью можно выводить информацию в символьном представлении 
на экран дисплея или периферийное устройство печати. Для стандартного пред- 
ставления таких символов используется код АЗСИ (Атешсап МаНопа|! Звапдаг@ 
Со4е юг шЮгтайоп ПиегсБапяе — Американский национальный стандартный 
код для обмена информацией). 

Представление символа А в соответствии со стандартом АЗСПИ выражается 
шестнадцатеричным значением 416, представление символа В — значением 428 
и т. д. Наличие стандартного кода облегчает обмен данными между различными 
устройствами компьютера. При этом 8-битовый расширенный код АЗСПИ, ис- 
пользуемый в компьютерах, обеспечивает представление 256 символов, включая 
символы национальных алфавитов. 


3.2. Первичные элементы языка ассемблера 


Все ассемблерные программы состоят из одного или более предложений и ком- 
ментариев. Предложение и комментарий представляют собой комбинацию зна- 
ков, входящих в алфавит языка, а также чисел и идентификаторов, которые тоже 
формируются из знаков алфавита. Макроассемблер МАЗМ распознает следую- 
щий набор знаков: 


АВСВЕЕСНГКЕММОРОВЗТИУНМХУ 
асе т ] К 1 мпораг $ фиумиху2 
0123456789 

2е_$: 20) < > {} 

18$! = ^^" 


Конструкции языка ассемблера формируются из идентификаторов и ограни- 
чителей. Идентификатор представляет собой наборбукв, цифр и символов _ ?, $ 
или @, причем первый элемент не должен быть цифрой. Идентификатор должен 
полностью размещаться на одной строке и может содержать от 1 до 31 символа 
(если их больше чем 31, то остальные игнорируются). 

Друг от друга идентификаторы отделяются пробелом или ограничителем, ко- 
торым считается любой недопустимый в идентификаторе символ. Посредством 
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идентификаторов представляются объекты программы, такие, как переменные, 
метки и имена. 

Переменные идентифицируют находящиеся в памяти данные и в общем слу- 
чае характеризуются тремя атрибутами: 


» сегментом, в котором определена переменная (действительно для 16-разряд- 
ных приложений, где полный адрес переменной формируется как сегмент: 
смещение; для 32-разрядных приложений этот атрибут не используется); 


» смещением данного поля памяти относительно начала сегмента; 
» типом, определяющим число, обрабатываемое при работе с переменной. 


Метка (1аБе!) является частным случаем переменной, причем ссылка на нее 
указывается в командах условного или безусловного перехода. Для 16-разрядных 
приложений метка характеризуется атрибутами сегмент:смещение, для 32-раз- 
рядных — только смещением. Метка также'‘может быть определена через другую 
метку с использованием директивы ЕСИ, как в этом примере: 


уаг1 Е) — 1аБе11 
Табе 1: 
моу АХ, 1 


Именами являются последовательности символов, определенные директивой 
ЕСИ и принимающие значение символа или числа. Другое название имени — кон- 
станта. Примеры имен: 

пате!: ЕО) ‘'АВСО’ 

$1914 Е0у 10 

Некоторые идентификаторы, называемые ключевыми словами, имеют предо- 
пределенный смысл. К ним относятся директивы ассемблера, команды (инструк- 
ции) процессора, имена регистров, операторы выражений. К таким идентифика- 
торам относится и указатель позиции (]осайоп соцтег), обозначаемый символом $. 

Указатель позиции представляет собой текущую позицию в текущем сегменте 
и имеет те же атрибуты, что и метка типа МЕАВ. Далее приведен пример использо- 
вания указателя позиции: 

$%г1п91 ВУТЕ "Тез ${г1пд” 

1е\е]  иОб 5 


гез ВУТЕ 10 ФР (?) 
Теп ЕОУ $-54г1191 


Константа 1еп в этом примере равна 22 (именно столько байтов памяти зани- 
мают переменные $1г1п91, 1еуе] и ге$). 

Следует помнить, что обычно ассемблер не различает строчные и прописные 
буквы и идентификаторы могут включать в себя буквы обоих регистров. Напри- 
мер, идентификаторы АБ$ и аБ$ считаются идентичными. Различие между строч- 
ными и прописными буквами может быть установлено параметрами /М. и /МХ 
макроассемблера МАЗМ. 

Рассмотрим типы и формы представления данных, которые могут быть ис- 
пользованы в выражениях, директивах и инструкциях языка ассемблера. Начнем 
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с целых чисел. Целые числа могут быть представлены набором цифр и/или сим- 
волов, после которых задается тип кодировки (основание счисления). Тип коди- 
ровки определяется одной из литер: В — двоичная, О — восьмеричная, О или Т — 
десятичная, Н — шестнадцатеричная. При этом шестнадцатеричные числа не 
должны начинаться с буквенных шестнадцатеричных цифр (например, вместо 
АВЬ следует использовать запись АВВ). Шестнадцатеричные цифры от А до Е 
могут кодироваться в обоих регистрах. 
Процессор оперирует с типами данных, определяемых директивами: 


» ОВ — распределение и инициализация 1 байта памяти для каждого из ука- 
занных значений. В качестве значения может кодироваться целое число, 
строковая константа, оператор Г\Р (см. далее), абсолютное выражение или 
знак 7. Знак ? обозначает неопределенное значение. Значения, если их не- 
сколько, должны разделяться запятыми. Если директива имеет имя, созда- 
ется переменная типа ВУТЕ с соответствующим данному значению указате- 
ля позиции смещением. Строковая константа может содержать столько 
символов, сколько помещается на одной строке. Символы строки хранятся 
в памяти в порядке их следования, то есть первый символ имеет самый 
младший адрес, последний — самый старший; 


® 0\— распределение и инициализация слова памяти (2 байта) для каждого 
из указанных значений. В качестве значения может кодироваться целое 
число, одно- или двухсимвольная константа, оператор БУР, абсолютное вы- 
ражение, адресное выражение или знак ?. Знак ? обозначает неопределен- 
ное значение. Значения, если их несколько, должны разделяться запятыми. 
Если директива имеет имя, создается переменная типа КОВ с соответствую- 
щим данному значению указателя позиции смещением. Строковая константа 
не может содержать более двух символов. Последний (или единственный) 
символ строки хранится в младшем байте слова. Старший байт содержит 
первый символ или, если строка односимвольная, ноль; 


® 00 — распределение и инициализация двойного слова памяти (4 байта) для 
каждого из указанных значений. В качестве значения может кодироваться 
целое число, одно- или двухсимвольная константа, действительное число, 
кодированное действительное число, оператор 0\Р, абсолютное выражение, 
адресное выражение или знак ?. Знак ? обозначает неопределенное значение. 
Значения, если их несколько, должны разделяться запятыми. Если директива 
имеет имя, создается переменная типа 0\0ЕО с соответствующим данному 
значению указателя позиции смещением. Строковая константа не может со- 
держать более двух символов. Последний (или единственный) символ строки 
хранится в младшем байте слова. Второй байт-содержит первый символ или, 
если строка односимвольная, ноль. Остальные байты заполняются нулями; 


» 00— распределение и инициализация 8 байт памяти для каждого из указан- 
ных значений. В качестве значения может кодироваться целое число, одно- 
или двухсимвольная константа, действительное число, кодированное дейст- 
вительное число, оператор ОУР, абсолютное выражение, адресное выражение 
или знак ?. Знак ? обозначает неопределенное значение. Значения, если их 


Во 
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несколько, должны разделяться запятыми. Если директива имеет имя, соз- 
дается переменная типа (иОВО с соответствующим данному значению указа- 
теля позиции смещением. Строковая константа не может содержать более 
двух символов. Последний (или единственный) символ строки хранится 
в младшем байте слова. Второй байт содержит первый символ или, если 
строка односимвольная, ноль. Остальные байты заполняются нулями; 


ОТ — распределение и инициализация 10 байт памяти для каждого из ука- 
занных значений. В качестве значения может кодироваться целое выраже- 
ние, упакованное десятичное число, одно- или двухсимвольная константа, 
кодированное действительное число, оператор ПУР или знак ?. Знак ? обо- 
значает неопределенное значение. Значения, если их несколько, должны 
разделяться запятыми. Если директива имеет имя, создается переменная 
типа Токо с соответствующим данному значению указателя позиции сме- 
щением. Строковая константа не может содержать более двух символов. 
Последний (или единственный) символ строки хранится в младшем байте 
слова. Второй байт содержит первый символ или, если строка односим- 
вольная, ноль. Остальные байты заполняются нулями. При обработке 
директивы ОТ подразумевается, что константы, содержащие десятичные 
цифры, представляют собой не целые, а десятичные упакованные числа. 
Чтобы в случае необходимости определить 10-байтовое целое число, сле- 
дует после числа указать спецификатор системы счисления (О или 4 для 
десятичных чисел, Н или В для шестнадцатеричных и так далее). Если в од- 
ной директиве определения памяти заданы несколько значений, им распре- 
деляются последовательные байты памяти. 


всех директивах определения памяти в качестве одного из значений может 


быть задан оператор ПУР. Он имеет следующий формат: 


счетчик ПУР (значение. ...) 


Указанный в скобках список значений повторяется многократно в соответст- 
вии со значением счетчика. Каждое значение в скобках может быть любым выра- 
жением, например целым числом, символьной константой или другим операто- 
ром БУР (допускается до 17 уровней вложенности операторов 0\Р). Значения, если 
их несколько, должны разделяться запятыми. Оператор ОР может использоваться 
не только в директивах определения памяти, но и в других директивах. 

Далее приводятся примеры директив определения данных: 


041 


08 1 

ОВ 'АВСО" 

08 ? 

ОМ 9325 

0 4*3 

Ом 1.'$' 

Ом аггау 

00 ‘хуг’ 

00 1.5 

00 18446744073709551615 


т1х1 08 5 0Р(5 0Р(5 0Р(10))} 
1х2 Ом 0Р(1.2.3.4.5)} 
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Рассмотрим способы представления (кодировки) для различных типов дан- 
ных. Вещественные числа (числа с плавающей точкой) кодируются с использова- 
нием одной из форм: 

хххх .ххххЁК] 

[[+|-])хххх .хххх[[Е[+|-] ххх] 

Здесь х — одна из цифр от 0 до 9. 

Кодированные вещественные числа могут использоваться в директивах 00, 00 
и ОТ, например: 

а1 00 56.23К 


а2 00 -45.68 
а3 00 211.77Е-2 


Десятичные числа кодируются так, как показано далее: 
[[+|- 2] хххх 


Здесь х — одна из цифр от 0 до 9. 

Следующий тип данных, который мы рассмотрим, — знаковые и строковые 
константы. 

Они могут быть представлены следующим образом: 

“сссссс' 

"ссссс" 

Здесь с — символы из допустимого диапазона. 

Часть строки исходного текста после символа точки с запятой (если он не явля- 
ется элементом знаковой константы или строки знаков) считается комментарием 
и ассемблером игнорируется. Комментарии вносятся в программу как поясняю- 
щий текст и могут содержать любые знаки до ближайшей комбинации символов 
возврата каретки и перевода строки (СВ/ЁЕ). 

В языке ассемблера очень часто используются так называемые символические 
имена, которые существенно упрощают программирование. Описание символи- 
ческих имен выполняется с помощью специальных директив. 

Символические имена могут представлять собой число, текст, инструкцию или 
адрес. Для описания символических имен в языке ассемблера служат директивы 
ЕЦ, ГАВЕЕ и директива присваивания =, 

Директива присваивания имеет такой формат: 


имя=выражение 


При помощи этой директивы создается имя, представляющее собой значение, 
равное текущему значению указанного выражения. Для хранения этого значения 
память не выделяется. Вместо этого каждое появление указанного имени в про- 
граммном коде замещается значением выражения. 

Символическое имя может быть переопределено. В каждой директиве при- 
сваивания в качестве имени может указываться уникальное имя или имя, ранее 
использованное другой директивой присваивания. 
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Выражение может быть целым числом, одно- или двухсимвольной строковой 
константой, константным или адресным выражением. Его значение не должно 
превышать 65 535. 

Примеры определения символических имен: 

16 = 167 

$4г1191 = 'аБ’ 

С015% = 7*4 

а09г1 = $г1п91 

Директива Е0Ц имеет следующий формат: 

имя ЕЦ выражение 


Директива ЕЦ создает абсолютное имя, псевдоним или текстовое имя путем 
присваивания имени указанного выражения. Под абсолютным именем здесь под- 
разумевается имя, представляющее собой 16-разрядное значение, а псевдонимом 
называется ссылка на другое имя. В качестве текстового имени может использо- 
ваться строка символов. При компиляции исходного текста каждое появление 
имени ассемблер замещает текстом или значением выражения, в зависимости от 
типа выражения. Имя должно быть уникальным и не может быть переопределе- 
но. В качестве выражения может задаваться целое число, строковая константа, 
вещественное число, кодированное вещественное число, мнемоника инструкции, 
константное или адресное выражение. Выражение, имеющее значением целое 
число, порождает имя, вхождения которого ассемблер замещает этим значением. 
Для всех остальных выражений вхождения имени замещаются текстом. 

Примеры применения директивы ЕО: 

К ЕСИ 1024 

а4г ЕЦ [ВР] 

с1е ЕО ХОВ АХ.АХ 

д ЕСЦ ВУТЕ РТВ 

1 ЕОУ "Ре" 

МАЗМ Е 5.1 + 0.9 


МЗРЕ ЕСИ <Мтсго$о1> 
мае ЕСИ 20*30 


Директива [АВЕ имеет следующий формат: 

имя ГАВЕЁ тип 

Директива 1АВЕ! порождает новую переменную или метку путем присваи- 
вания имени указанного типа и текущего значения указателя позиции. Имя 
должно быть уникальным и не может быть переопределено. В качестве типа 
может быть задано одно из следующих ключевых слов: ВУТЕ, НОВО, ООО, ОмОво, 


ТВУТЕ, МЕАВ, РАК. 
Примеры использования директивы ЕАВЕГ: 


Буте_аггау — ЁАВЕЁ ВУТЕ 
мог аггау м 10 [\Р(0) 


Здесь имена Бу{е_аггау и мог _аггау ссылаются на одну и ту же область памяти. 
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3.3. Программная модель процессора Те! РепНит 


Для понимания работы команд ассемблера необходимо четко представлять, как 
выполняется адресация данных, какие регистры процессора и как могут исполь- 
зоваться при выполнении инструкций. Сейчас мы рассмотрим базовую программ- 
ную модель процессоров ие] Репйит, в которую входят: 


8 регистров общего назначения, служащих для хранения данных и указа- 
телей; 


регистры сегментов — они хранят 6 селекторов сегментов, 


регистр управления и контроля ЕРГАбЗ, который позволяет управлять со- 
стоянием выполнения программы и состоянием (на уровне приложения) 
процессора; 


регистр-указатель Е1Р выполняемой следующей инструкции процессора; 
система команд (инструкций) процессора; 
режимы адресации данных в командах процессора. 


Начнем с описания базовых регистров процессора Пие! Репбит. 

Базовые регистры процессора Пие! РепНит являются основой для разработки 
программ и позволяют решать основные задачи по обработке данных. Все они по- 
казаны на рис. 3.6. 


Регистры общего назначения 
31 0 


Сегментные регистры 
15 0 


Регистры общего назначения 
31 0 


К Елб 


Регистры общего назначения 
31 0 


[Г в 


Рис. 3.6. Базовые регистры процессора Те! Репбит 
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Среди базового набора регистров выделим отдельные группы и рассмотрим 
их назначение. Начнем с 32-разрядных регистров общего назначения (ЕАХ, ЕВХ, 
ЕСХ, ЕОХ, ЕЗТ, ЕБТ, ЕВР, ЕЗР), которые могут использоваться в качестве: 


® операндов в арифметических и логических операциях; 
® операндов при вычислении адресов операндов; 
» указателей на переменные в памяти. 


Несмотря на то что любой из этих регистров можно использовать для выше- 
перечисленных операций, необходимо учитывать специфику применения регист- 
ра ЕР — он служит для хранения указателя стека, поэтому задействовать его для 
других целей не рекомендуется. Во многих программах требуется хранить в реги- 
страх определенные значения операндов в процессе выполнения каких-либо опе- 
раций. Для этого подходят регистры ЕСХ, Е51 и ЕБТ. Если при этом используется 
отдельный сегмент данных, то некоторые команды ассемблера предполагают, что 
переменная, адресуемая одним из этих регистров, находится в сегменте данных, 
определяемом регистром 05. 

Во многих случаях регистры общего назначения используются для предопре- 
деленных целей: 


® ГАХ выполняет функцию аккумулятора при работе с операндами и хранит 
результат операции; 


® ЕВХ-— указатель на данные, находящиеся в сегменте данных, адресуемом ре- 
гистром 05; 


® ЕСХ — счетчик циклов и элементов при строковых операциях; 
® Е0Х — указатель на порты устройств ввода-вывода; 


® Е5[ — указатель на данные, находящиеся в сегменте, адресуемом регист- 
ром 0$ (при выполнении строковых операций содержит смещение строки- 
источника); 


® Е0Г — указатель на данные, находящиеся в сегменте, адресуемом регистром 
Е5 (при выполнении строковых операций содержит смещение строки-при- 
емника); 


® ЕЗР содержит указатель стека в сегменте стека, адресуемом регистром 55; 


® ЕВР содержит указатель на данные, находящиеся в стеке, адресуемом реги- 
стром 55. 


Младшие 16 бит 32-разрядных регистров общего назначения могут адресо- 
ваться так же, как и 16-разрядные регистры в процессорах 8086 с именами АХ, ВХ, 
СХ, ОХ, ВР, 51, ОТ, ЗР. В свою очередь, 16-разрядные регистры АХ, ВХ, СХ и ОХ позволя- 
ют обращаться отдельно как к старшим 8-разрядным регистрам (АН, ВН, СН, ОН), так 
и к младшим (А|, В, С1, 0%). Это проиллюстрировано рис. 3.7. 

Сегментные регистры (65, 05, 55, Е5, РЗ и 65) содержат 16-разрядные селекто- 
ры сегментов. Селектор представляет собой специальный указатель, который 
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идентифицирует данный сегмент в памяти, Более подробно мы остановимся на 
использовании сегментных регистров в главе 4. 


31 1615 87 О0 316ит 16бит Вбит 
АХ АН/АЕ 
вх ВНИВЬ 
сх СНиСь 
ох ОНь 





Рис. 3.7. Использование регистров общего назначения 


Помимо регистров общего назначения и сегментных регистров, как мы знаем, 
в базовой архитектуре имеется еще два регистра: регистр управления/состояния 
ЕРЬАб$ и регистр-указатель адреса следующей инструкции Е!Р. Рассмотрим их 
более подробно. 

Регистр ЕЕТАРФ, часто именуемый регистром флагов, имеет 32 разряда и содер- 
жит группу битов или, как их чаще называют, флагов состояния, управляющий 
флаг и группу системных флагов. На рис. 3.8 показана структура регистра флагов 
и приводится расшифровка наиболее часто используемых флагов. 


16 15 14 13 12 11 0 98765432 


ОР (Ометом Рад) 
ОР (Огесйоп Рад) 





ЗЕ (Зюп Раб) 
2Е (2его Рад) 


АР (АихШагу Р!а9) 


РЕ (Ращу Рад) 


СЕ (Саггу Рад) 


Рис. 3.8. Регистр управления/состояния процессора 
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Указанные на рис. 3.8 флаги наиболее часто используются в прикладных про- 
граммах и сигнализируют о следующих событиях: 


® ОГ (флаг переполнения) фиксирует ситуацию переполнения, то есть выход 
результата арифметической операции за пределы допустимого диапазона 
значений; 


® ОЕ (флаг направления) используется командами обработки строк. Если 
ОЕ = 0, строка обрабатывается в прямом направлении, от меньших адресов 
к большим. Если ОЕ = 1, обработка строк ведется в обратном направлении; 


® Г (флаг знака) показывает знак результата операции, при отрицательном 
результате $2 = 1; 


® 7 (флаг нуля) устанавливается в 1, если результат операции равен 0; 


® А (флаг вспомогательного переноса) используется в операциях над упако- 
ванными двоично-десятичными числами. Этот флаг служит индикатором 
переноса или заема из старшей тетрады (бит 3); 


® РЕ (флаг четности) устанавливается в 1, если результат операции содержит 
четное число двоичных единиц; 


® СГ (флаг переноса) показывает, был ли перенос или заем при выполнении 
арифметических операций. 


Из всех этих флагов только флаг переноса СГ может устанавливаться или 
сбрасываться непосредственно при помощи команд ассемблера 5%с, с1с и спс. 
Кроме того, в этот флаг может быть скопирован бит, определенный командами 
БЕ, БЕ5, Бег и Вс. 

Флаги состояния также используются при анализе операций, результатами 
которых являются беззнаковые целые числа, целые числа со знаком и упакован- 
ные (ВС) целые числа. Если результатом операции является беззнаковое целое 
число, то установка флага переноса СЕ в 1 (перенос или заем) свидетельствует 
о выходе за пределы допустимого диапазона. Если результатом операции являет- 
ся целое число со знаком (двоичное дополнение числа), то об этом свидетельст- 
вует установка в 1 флага переполнения 02. 

В случае если результат операции интерпретируется как число в формате 
ВСО, то установка флага АЕ свидетельствует о возникновении переноса или 
заема. Флаг 5Е указывает на знак результата, являющегося знаковым числом. 
Флаг 7Е указывает на равенство нулю знакового или беззнакового числа. 

При выполнении операций целочисленной арифметики с повышенной точно- 
стью флаг переноса СЕ используется командами абс (сложение с переносом) и $55 
(вычитание с заемом) для того, чтобы учитывать перенос при переходе к следую- 
щей операции сложения или вычитания. 

Флаги состояния используются командами условного перехода )СС (СС — 
код условия: ед, Те, 1%, пе ит. д.), командами зе СС, 100рСС и стоуСС. 

Флаги состояния процессора могут быть помещены в стек и извлечены из сте- 
ка командами риз НЕ, ризНТа, рор?, рор*4. Кроме того, флаги могут быть загружены 
в старшую половину регистра АХ или извлечены из старшей половины при помо- 
щи команды 1а1{ или за1Т. 
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Перейдем к описанию регистра Е!Р — он содержит смещение в программном 
сегменте следующей выполняемой команды. Если в программе встречаются ко- 
манды )СС, са11, ге или 1геф, то содержимое регистра Е1Р может измениться про- 
извольным образом — смещение следующей команды может быть как положи- 
тельным, так и отрицательным. Содержимое регистра-указателя следующей 
команды не может быть изменено какой-либо инструкцией напрямую, хотя мож- 
но получить его содержимое, если выполнить команду са11, а затем прочитать 
указатель на следующую команду, находящийся в стеке. 

Регистр Е1Р можно модифицировать, опять-таки не прямо, а через стек, за- 
менив адрес следующей команды. Естественно, перед этим следует выполнить 
команду са11. 

Прежде чем приступить к анализу команд ассемблера и способов обработки 
данных, нам необходимо рассмотреть модели памяти, с которыми может работать 
процессор. Модель памяти определяет способ организации программ и данных 
в памяти компьютера. В 32-разрядной архитектуре процессора \{е| Репйит 
используются три модели памяти: 


®» плоская, или линейная, модель памяти (Йа тетогу то4е]) — память пред- 
ставляет собой непрерывное пространство адресов. Такое пространство ад- 
ресов называется линейным. Программный код, данные, область стека рас- 
полагаются в этом пространстве адресов. Адресное пространство в этой 
модели адресуется побайтно, а диапазон адресов равен 232. Схематично эта 
модель памяти показана на рис. 3.9; 


Линейное 
адресное 
пространство 


22 _1 


Линейный адрес ® ® ® 
ГГ 


Рис. 3.9. Линейная модель памяти 


® сегментированная модель памяти (зевтеще тетогу шо4е]) — память 
состоит из трех отдельных пространств адресов, которые называются сег- 
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ментами. При этом программный код, данные и стек размещаются в от- 
дельных сегментах памяти. Для того чтобы обратиться к байту в памяти, 
программа формирует логический адрес, состоящий из адреса сегмента 
(селектора сегмента) и смещения. Программы, выполняющиеся в 32-раз- 
рядном режиме, могут использовать до 16 383 сегментов разного размера, 
каждый из которых может иметь размер 23? байт. Схема адресации для сег- 
ментированной модели памяти показана на рис. 3.10. 


Селектор сегмента 
Г] — 


Рис. 3.10. Сегментированная модель памяти 
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Механизм преобразования адресов при использовании сегментированной 
модели таков: вначале все адреса сегментов, определенных в программе, 
отображаются на общее линейное пространство адресов, доступное процес- 
сору. Затем логический адрес операнда в памяти преобразуется в линей- 
ный адрес из пространства адресов. Все эти преобразования прозрачны для 
работающей программы. Подобная модель позволяет повысить надежность 
работы программ. Например, если разместить программный код и область 
стека в разных сегментах, то в случае резкого увеличения размера стека не 
произойдет перекрытия программного кода данными из стека; 


модель реального режима адресации (геа]-а44гез$ по4е тетогу то4е!) — 
это модель памяти, используемая в процессорах 8086. Данная модель памя- 
ти поддерживается для того, чтобы обеспечить совместимость с ранее раз- 
работанными 16-разрядными приложениями. В этой модели применяется 
механизм сегментации, причем максимальный размер сегмента не превы- 
шает 64 Кбайт. Максимальный размер линейного адресного пространства, 
доступного в этом режиме, равен 220 байт. 
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При разработке 32-разрядных программ на языке ассемблера обычно исполь- 
зуется линейная, или плоская, модель памяти. Все примеры 32-разрядных проце- 
дур, приведенные в этой и последующих главах, разработаны с использованием 
этой модели. При 32-разрядной адресации операндов логический адрес состоит 
из 16-разрядного селектора сегмента и 32-разрядного смещения. При 16-раз- 
рядной адресации логический адрес состоит из 16-разрядного селектора сегмента 
и 16-разрядного смещения. 

При выполнении любой программы процессор обращается к памяти, в кото- 
рой хранятся команды и данные. Для доступа к данным необходимо каким-то об- 
разом определять их адрес в памяти. Способ формирования адреса операнда или 
метки перехода на другую команду называется режимом адресации, или адреса- 
цией. 

Инструкции ассемблера включают самые разнообразные команды, работающие 
как с операндами, так и без них. Некоторые команды требуют явного указания 
операндов, в то время как другие используют операнды по умолчанию. Данные 
операнда-источника могут находиться в регистре, памяти, в порту ввода-вывода 
или задаваться непосредственно в инструкции. Операнд-приемник может рас- 
полагаться в оперативной памяти, в регистре или быть портом ввода-вывода. 

Для четкого понимания того, как осуществляется адресация данных, проана- 
лизируем способ образования адреса операнда. Адрес операнда формируется по 
схеме сегмеит:смещение. В зависимости от используемой модели памяти адрес 
переменной в памяти может формироваться как 16 : 16 или 16: 32. Смещение 
операнда называется его эффективным или исполнительным адресом (ЕНесиуе 
АЧЯгезз, ЕА). 

Селектор сегмента можно указать явным или неявным образом. Обычно селек- 
тор сегмента загружается в сегментный регистр, а сам регистр выбирается в зави- 
симости от типа выполняемой операции, как показано в табл. 3.2. 


Таблица 3.2. Критерии выбора сегментного регистра 


Тип операции Регистр сегмента Сегмент Описание 

Команды процессора С$ Программный Используется при вызовах 
сегмент команд процессора 

Обращение к стеку $5 Сегмент стека Используется во всех операциях 


со стеком, а также в операциях 
с памятью, в которых базовыми 
являются регистры Е5Р и ЕВР 


Локальные данные 05 Сегмент данных — Используется во всех операциях 
с данными, исключая те, 
в которых применяется стек 
или строка-приемник 
при выполнении 


строковых операций 
Строки-приемники Е Сегмент данных,  Операнд-приемник в строковых 
адресуемый операциях 


регистром Еб 
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Процессор автоматически выбирает сегмент в соответствии с условиями, опи- 
санными в табл. 3.2. При сохранении операнда в памяти или загрузке из памяти 
в качестве сегментного регистра по умолчанию используется 05, но можно и.яв- 
ным образом указать сегментный регистр, применяемый в операции. 

’. Пусть, например, требуется сохранить содержимое регистра ЕАХ в памяти, 
адресуемой сегментным регистром Е$ и смещением, находящимся в регистре ЕВХ. 
В этом случае можно использовать команду 


`тоу Е$:ЕВХ]. ЕАХ 


Обратите внимание на то, что после имени сегмента указывается символ двое- 
точия. 

На уровне процессора замена сегмента задается специальным префиксом за- 
мены, который является однобайтовым числом, располагающимся перед кодом 
команды. В некоторых случаях замена сегмента не допускается: 


® для сегмента программного кода — все команды используют исключитель- 
но сегментный регистр 6$; 


® при выполнении строковых операций с1 строка-приемник адресуется только 
регистром Е5; 


® операции помещения в стек и ‘извлечения из стека всегда используют ре- 
гистр.5$:° - 
Некоторые инструкции процессора требуют явной инициализации сегментных 
регистров. В таких случаях селектор сегмента может быть извлечен из 16-разряд- 
ного регистра или переменной в памяти, как, например, В следующей команде: 


тоу ‘05: -ВХ 


Здесь селектор сегмента, находящийся в регистре ВХ, помещается в сегмент- 

ный регистр 05. В некоторых случаях селектор сегмента может определяться че- 
рез 48-разрядный указатель, находящийся в памяти. При этом младшее двойное 
слово содержит 32-разрядное смещение, а старшее слово — 16-разрядный селек- 
тор сегмента. 
. В большинстве случаев программисты имеют дело с эффективным адресом 
операнда, то есть с той частью полного адреса операнда, которая определяет сме- 
щение. операнда в указанном сегменте. Очень часто термины «эффективный 
адрес» и «смещение» воспринимаются как синонимы при анализе способов адре- 
сации операндов, хотя это не совсем так. Для того чтобы избежать путаницы в даль- 
нейшем, мы будем употреблять более корректный термин «эффективный адрес» 
вместо термина «смещение», а под смещением понимать числовое значение, кото- 
рое прибавляется к определенному адресу. 

Эффективный адрес операнда, находящегося в памяти, может быть задан не- 
сколькими способами. В общем `случае ‘мы можем определить ‘эффективный ад- 
рес операнда как состоящий из нескольких частей: 

® смещения, представляющего собой 8-, 16- и 32-разрядное значение; 


® базы, представляющей собой содержимое одного из регистров общего на- 
значения; 
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® индекса, представляющего собой содержимое одного из регистров общего 
назначения; 


® масштабного множителя, равного 2, 4 или 8. 


Эффективный адрес, в общем случае, представляет собой сумму смещения, базы 
и индекса, причем эта сумма может быть скорректирована с помощью масштабно- 
го множителя. Схематически это можно представить так, как показано на рис. 3.11. 


База Индекс Множитель Смещение 
БАХ ЕАХ 1 

ЕСХ ЕВХ 8 бит 
ЕОХ ЕСХ 2 

ЕЗР + ЕОХ х = 16 бит 
ЕВР ЕВР 4 

ЕЗ! ЕЯ 32 бита 
ЕЙ! ЕО! 8 


ЕА = База + (Индекс х Множитель) + Смещение 
Рис. 3.11. Схема вычисления эффективного адреса (ЕА) 


Существуют определенные ограничения, касающиеся применения регистров 
общего назначения в качестве базовых или индексных при формировании эф- 
фективного адреса: 


® регистр ЕЗР нельзя использовать в качестве индексного регистра; 


® если в качестве базового используется регистр ЕЗР или ЕВР, то сегментным 
регистром будет 5$. Во всех остальных случаях сегментным регистром по 
умолчанию является 05. 


Следует заметить, что база, индекс и смещение могут применяться в любых 
комбинациях, причем любой компонент может отсутствовать. Масштабирующий 
множитель применяется только с индексом. Рассмотрим различные комбинации 
компонентов для получения эффективного адреса. 

Вариант 1. Для формирования эффективного адреса используется только 
смещение. Такую адресацию называют прямой. При этом способе адресации эф- 
фективный адрес берется прямо из поля смещения команды и никакие регистры 
для его вычисления не привлекаются. Этот режим служит для обращения к про- 
стым переменным, как показано в примере 


тмоу АХ. мет] 

Здесь пет1 — операнд в памяти. Как операнд-источник, так и операнд-приемник 
должны иметь одинаковый размер, иначе в процессе компиляции будет выдана ошиб- 
ка. Так, в нашем примере подразумевается, что переменная тет1 определена как сло- 


во. Если, например, операнд в памяти является двойным словом, то в команде нуж- 
но явным образом указать старшую или младшую часть с помощью оператора РТВ: 


моу АХ, мога рёг мет 


Предположим, что переменная пет1 определена как двойное слово. Тогда по- 
казанная ранее команда поместит в регистр АХ значение 107ЕЬ (рис. 3.12). 
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Младший Старший 
байт байт 


Рис. 3.12. Размещение переменной тет1 в памяти 


Если нужно сохранить в регистре АХ значение старшего слова переменной пет], 
то следует применить команду 


тоу АХ, мога рёг тет1+2 

В этом случае в регистр АХ помещаются старшие два байта переменной пет] 
(см. рис. 3.12), после чего АХ будет содержать значение ОЕСЗАВ (обратите внима- 
ние на порядок расположения байтов!). 


Остановимся более подробно на операторе РТК. В общем случае этот оператор 
можно представить в виде 


тип РТВ выражение 


При помощи оператора РТВ переменная или метка, задаваемая выражением, 
может трактоваться как переменная или метка указанного типа. Тип может быть 
задан одним из имен или значений, показанных в табл. 3.3. 


Таблица 3.3. Атрибуты оператора РТВ. 


‚ Тип Значение 

ВУТЕ 1 

МОРО 2 

ОМОАВ 4 

ОМОРО 8 

ТВУТЕ 10 

МЕАК ОРЕРЕВ 
РАК ОРРРЕК 


Выражение может включать в себя любые операнды. Типы ВУТЕ, \ОКО, ОмОКО, 
НОВО и ТИОКО могут быть использованы только с операндами памяти, а типы МЕАВ 
и ЕАК — только с метками. Если РТК не используется, то ассемблер подразумевает 
умалчиваемый тип ссылки. Кроме того, оператор РТК служит для организации 
доступа к объекту, который при другом способе привел бы к ошибке компиляции 
(например, для доступа к старшему байту переменной размера ОВО). 

Вариант 2. Для формирования эффективного адреса используется только со- 
держимое базового регистра («база»). Такая адресация называется базовой и слу- 
жит для адресации динамических структур данных, например строк и массивов. 
Этот способ адресации иногда называют «косвенной адресацией». 

Рассмотрим пример программного кода 


Теа ВХ, мет 
моу АХ, [ВХ] 


В этом примере тет! — переменная в памяти размером в слово. Первая ко- 
манда загружает адрес переменной в регистр ВХ, а вторая помещает в регистр АХ 
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‚ значение, содержащееся по адресу, который находится в ВХ. Работу этого фраг- 
мента кода иллюстрирует рис. 3.13. 


тет1 


Младшие 1С05 1С06 1С07 Старшие 
адреса памяти " т. ТЕГ адреса памяти 






Младший Старший 


байт байт 
1еа ВХ, тет1 
15 0 
1С06 вх 
тоу АХ, [ВХ] 
15 0 


ом] 


Рис. 3.13. Схема косвенной адресации 


Предположим, что переменная пет! размером в слово имеет значение 1 АЭЕЬ 
и занимает два байта в памяти с адресами 1СО6Ь (младший байт) и 1СО7 (стар- 
ший байт). После выполнения первой команды в регистре ВХ будет находиться 
адрес переменной пет1, являющийся одновременно и адресом первого элемента. 
Вторая команда помещает в регистры АХ значение переменной пет1. 

Вариант 3. Для формирования эффективного адреса операнда используется 
содержимое базового регистра плюс смещение («база + смещение»). Такой вари- 
ант адресации удобен в двух случаях: 


» при доступе к элементам массива, размер которых не кратен 2. В этом.слу- 
чае базовый регистр содержит адрес массива, а смещение позволяет полу- 
чать доступ к произвольному элементу массива; 


» при доступе к полям записей или структур. При этом базовый регистр со- 
держит адрес начала записи или структуры, а смещение определяет эле- 
мент, к которому нужно получить доступ. Отдельный, но очень важный 
случай применения этого варианта — извлечение параметров процедуры из 
стека посредством регистра ЕВР, который служит базовым. При этом пара- 
метры извлекаются из стека по фиксированным смещениям. 


Основное применение базовой адресации — получение доступа к элементам 
строк и массивов, когда известен начальный адрес данных, а смещение вычис- 
ляется в процессе выполнения программы. В макроассемблере МАЗМ можно 
использовать одну из форм записи: 


[база + смещение] 
[база] [смешение] 
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Здесь база — регистр, содержащий базовое значение адреса, а смещение — значе- 
ние, которое определяет позицию элемента данных. Вот пример базовой адресации: 


$1 08 "5&г1пд 1" 

Теа ЕВХ. $1 

тоу АЕ. Буфе рёг [ЕВХ1[5] 

Здесь первая команда (1еа ЕВХ. $1) помещает в регистр ЕВХ адрес строки, кото- 
рый одновременно является и адресом первого элемента (имеющего индекс 0). 
Во время выполнения второй команды к содержимому регистра ЕВХ прибавляется 
значение 5, указывая на 6-й по порядку элемент строки 51 (это символ 9), после 
чего значение этого символа помещается в регистр А‘. Таким образом, после вы- 


полнения второй команды регистр АЕ будет содержать символ 9. Алгоритм выпол- 
нения этого фрагмента программного кода показан на рис. 3.14. 


$1 





|ва ЕВХ, $1 | ЕВХ 





Рис. 3.14. Схема базовой адресации 


Вариант 4. В следующем режиме эффективный адрес формируется по прин- 
ципу «индекс + смещение». Смещение при таком способе адресации указывает на 
начало массива чисел или строки, а индексный регистр содержит номер элемента. 
данных. Например, в показанном ниже фрагменте программного кода в регистр 
АЕ помещается элемент строки $1 с индексом 10 (11-й элемент строки, символ +): 


$1 08 "164856 * (+1 
поу ЕВХ. 10 
тоу АЕ. Бубе рёг $1[ЕВХ] 
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Вариант 5. В следующем режиме эффективный-адрес формируется. по. нрин-- 
ципу: «(индекс х множитель). + смещение». Множитель обычно используется для 
доступа к элементам, имеющим размер, кратный 2, например к словам, двойным 
словам и т. д. Смещение при таком способе адресации указывает на начало мас- 
сива чисел или строки, а индексный регистр содержит номер элемента данных. 
Далее показан пример, который демонстрирует этот способ адресации: - 


$1 08 “0123456789АВСОЕЕ" 


пу ЕВХ. 7 
пои А. Буе рёг $11ЕВХя2] 


При указанном значении регистра ЕВХ в регистр А будет помещен символ Е, 
поскольку он находится по смещению 14 (7х 2) в строке $1. 

Вариант 6. В следующем режиме эффективный адрес формируется по прин- 
ципу «база + индекс + смещение». Такой способ адресации обычно используется 
для адресации элементов в двухмерных массивах данных или для доступа к от- 
дельным элементам в массивах, содержащих запиби. Проанализируем фрагмент 
программного кода, в котором применяется данный способ адресации: 


$1 08 “АВСО ЕРОН ТОКЕМ" 
52 08 “абс етап 1)К1т" 
$3 08 "0123 4567 В9" 
заггау Табе] дмога 

00 $1 

06 $2 

00 $3 


поу ЕВХ. заггау+4 
у Е51. 10 
ту А, Буе рёг [ЕВХ1[Е$Т 12] 


Здесь в сегменте данных определен массив строк заггау, содержащий адреса 
строк $1 - $3. В каждой строке определены группы элементов, разделенные сим- 
волом пробела. Предположим, нужно получить доступ к символу К, находящему- 
ся в строке $2. Будем использовать регистр`ЕВХ как базовый, а регистр Е51 как 
индексный. Поместим в ЕВХ адрес строки $2, где находится искомый элемент (ко- 
манда тоу ЕВХ. заггау+4), а в регистр ЕЗТ — смещение группы элементов, в которой 
находится символ К (величина смещения ‘в’данном случае равна 10). Для этого 
выполним команду 


тоу ЕЗТ. 10 


Символ К находится по смещению 2 относительно группы элементов 1 )К1м, по- 
этому последняя команда помещает символ в регистр А: 


тоу АЕ. Буфе рёг [ЕВХ[Е$1Т7Ё2] 


Вариант 7. В последнем. режиме эффективный адрес формируется по принципу 
«база + (индекс х множитель) + смещение». Такой способ адресации обычно требу- 
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ется для адресации элементов в двухмерных массивах данных, когда нужно полу- 
чить доступ к словам, двойным словам или учетверенным словам. Проанализируем 
фрагмент программного кода, в котором применяется данный способ адресации: 


а1 00 45, -87, 23. -11, 83. -442. 56, -340 
а2 00 92. -31. 9. -598. 361. 406. -172. 7 
а3 00 234, 8. -177, 921. 380. -12. 0. -51 
Таггау Табе] дмога 

00 а1 

00 а2 

00 а3 


пох  ЕВХ. Таггау+8 
пу ЕТ. 4 
поу ЕАХ, [ЕВХ][Е51*23 [8] 


Здесь определены три массива целых чисел (а1 — а3), состоящих из двухслов- 
ных элементов. Предположим, требуется поместить число 380 (выделенное жир- 
ным шрифтом) в регистр ЕАХ. Для этого воспользуемся несколько искусственной 
схемой, которая поможет понять суть этого метода адресации. 

В регистр ЕВХ поместим адрес массива а3 (команда тоу ЕВХ. Таггау+8), в кото- 
ром находится искомое число. Таким образом, регистр ЕВХ будет использоваться 
как базовый. Регистр ЕЗ1 будет выступать в качестве индексного, куда мы поме- 
стим значение 4 (размер двойного слова в байтах) с помощью команды 


ту ЕЗТ. 4 


Наконец, последняя команда загружает искомый элемент массива а3 (380) 
в регистр ЕАХ: 


тоу ЕАХ. [ЕВХ][Е$1*29[8) 


В этой команде выражение [Е51*2], равное 8, указывает на элемент массива а3 
с индексом 2 (то есть число —177), а выражение [В] определяет смещение на 8. 
В результате суммирования всех значений (ЕВХ, ЕЗТ, В) получаем эффективный 
адрес (ЕА) искомого элемента. 

Как видим, базово-индексные способы адресации представляют собой мош- 
ный механизм, обеспечивающий удобный доступ к любым структурам данных из 
программ на языке ассемблера. 

Хочу сделать важное замечание: все семь рассмотренных вариантов адресации 
проверены на компиляторе МАЗМ версии 7.10 из пакета \/ш4о\з ХР ООК. 

Рассмотрим еще один способ адресации данных в памяти, который использу- 
ется в ряде случаев и называется непосредственной адресацией. При этом спосо- 
бе адресации операнд задается непосредственно в инструкции. Например, сле- 
дующая команда вычитает значение 20 из регистра ЕАХ: 


$иБ ЕАХ, 20 


Все арифметические команды, за исключением команд Ф1\ и 141\, допускают 
непосредственную адресацию. Максимальное значение непосредственного операн- 
да варьируется для разных команд, однако в любом случае не может превышать зна- 
чения, которое может принимать операнд размером в двойное слово без знака (23). 
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Последний способ адресации, который мы проанализируем, — регистровая 
адресация. При регистровой адресации операнд находится в регистре общего на- 
значения, а в некоторых случаях — в сегментном регистре. Если команда имеет 
два операнда, то в большинстве случаев они могут быть регистрами. Вот примеры 
регистровой адресации: 


моу  ЕАХ, Е0Х 
294 — ЕАХ, ЕСХ 


Оба операнда должны иметь одинаковую размерность. Следующая команда 
вызовет ошибку: 


тоу ЕАХ. ВЁ 


Здесь оба операнда — регистры ЕАХ и ВЕ — имеют разную размерность, поэтому 
компилятор выдаст ошибку при трансляции этой команды. 

Рассмотрим вкратце команды общего назначения процессора ие! Репцит. 
Более детальный анализ всех групп команд мы будем проводить в следующих 
главах, когда будут рассматриваться практические аспекты применения языка 
ассемблера. Команды общего назначения (яепега]-ригрозе шзёгисНоп$) по функ- 
циональному признаку можно разделить на несколько групп: 


® команды перемещения (пересылки, передачи) данных; 


® команды целочисленной арифметики (сложения, вычитания, умножения 
и деления); 


® команды логических операций; 


® команды передачи управления (условных и безусловных переходов, вызо- 
вов процедур); 

® команды строковых операций (иногда встречается название «строковые, 
или цепочечные, команды»). 


Часть команд сложно отнести к какой-либо группе (например, команды поме- 
щения данных в стек или извлечения данных из стека, команды работы с таблич- 
ными данными ит. д.). 

Большинство команд работают с операндами в памяти, адресуемыми одним из 
способов, рассмотренных ранее, а также с регистрами общего назначения (ЕАХ, 
ЕВХ, ЕСХ, ЕОХ, ЕЗТ, ЕОТ, ЕВР, ЕЗР)) и с регистрами сегментов (($, 0, $$, Е, Е$, 65). 

Макроассемблер МАЗМ версии 6.14 и выше поддерживает все основные ко- 
манды процессора пе] РепНит, а также специальные группы команд ММХ-, 
$5Е- и $5Е2-расширений, которые подробно рассматриваются в последующих 
главах. Перечень всех команд процессора приводится в приложениях А и Б. 


Структура программы 
на языке ассемблера 





Материал этой главы посвящен вопросам организации и компоновки программ- 
ного кода на языке ассемблера. Затронуты вопросы взаимодействия различных 
частей ассемблерной программы, организации сегментов программного кода, дан- 
ных и стека в контексте различных моделей памяти. Напомню, что мы рассматри- 
ваем эти аспекты применительно к макроассемблеру МАЗМ фирмы Мгсгозой, 
хотя многие положения действительны и для других компиляторов. Начнем с ана- 
лиза сегментов. Мы уже сталкивались с этими вопросами в главе 3, сейчас же рас- 
смотрим их более детально. 


4.1. Организация сегментов 


Для хорошего понимания, как работает программа на ассемблере, нужно очень 
четко представлять себе организацию сегментов. Применительно к процессорам 
Пи! Репйим термин «сегмент» имеет два значения: 


® Область физической памяти заранее определенного размера. Для 16-раз- 
рядных процессоров размер сегмента физической памяти не может превы- 
шать 64 Кбайт, в то время как для 32-разрядных может достигать 4 Гбайт. 


®» Область памяти переменного размера, в которой могут находиться про- 
граммный код, данные или стек. 


Физический сегмент может располагаться только по адресу, кратному 16, или, 
как иногда говорят, по границе параграфа. Логические сегменты тесно связаны 
с физическими. Каждый логический сегмент ассемблерной программы определя- 
ет именованную область памяти, которая адресуется селектором сегмента, содер- 
жащимся в сегментном регистре. Сегментированная архитектура создает опреде- 
ленные трудности в процессе разработки программ. Для небольших программ, 
меньших 64 Кбайт, программный код и данные могут размещаться в отдельных 
сегментах, поэтому никаких особых проблем не возникает. 
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Для больших программ, занимающих несколько сегментов кода или данных, 
необходимо правильно адресовать данные, находящиеся в разных сегментах дан- 
ных. Кроме того, если программный код находится в нескольких сегментах, то 
усложняются реализация переходов и ветвлений в программе, а также вызовы про- 
цедур. Во всех этих случаях требуется задавать адреса в виде сегмент:смещение. 

При использовании 32-разрядного защищенного режима эти проблемы исче- 
зают. Например, в плоской модели памяти (о ней мы поговорим чуть позже) для 
адресации программного кода и данных достаточно 32-разрядного эффективного 
адреса внутри непрерывной области памяти. 

Логические сегменты могут содержать три основных компонента программы: 
программный код, данные и стек. Макроассемблер МАЗМ обеспечивает правиль- 
ное отображение этих компонентов на физические сегменты памяти, при этом 
сегментные регистры ($, 05 и $$ содержат адреса физических сегментов памяти. 


4.2. Директивы управления сегментами 
и моделями памяти макроассемблера МАЗМ 


В макроассемблер МАЗМ включены директивы, упрощающие определение сег- 
ментов программы и, кроме того, предполагающие те же соглашения, которые ис- 
пользуются в языках высокого уровня М1сгозой. Упрощенные директивы опре- 
деления сегментов генерируют необходимый код, указывая при этом атрибуты 
сегментов и порядок их расположения в памяти. Везде в этой книге мы будем 
использовать именно упрощенные директивы определения сегментов, наиболее 
важные из которых перечислены далее: 


® _ПАТА (.Чафа) — определяет начало инициализированного сегмента данных 
с именем _ПАТА и при наличии предыдущего сегмента завершает его. Этой 
директиве должна предшествовать директива .МООЕЕ. Сегмент, определен- 
ный с атрибутом .ОАТА, должен содержать только инициализированные 
данные, то есть имеющие начальные значения, например: 


дата 
уа11 м 11 
${г1п91 08 “Тех $4г1пд" 
уе! 08? 


® _ПАТА? (.дафа?) — определяет сегмент данных, в котором располагаются не- 
инициализированные данные. При наличии предыдущего сегмента новый 
сегмент завершает его. Неинициализированные данные могут объявляться 
в сегменте .ОАТА? при помощи оператора ?. Преимуществом директивы 
.ВАТА? является то, что при ее использовании уменьшается размер испол- 
няемого файла и, кроме того, обеспечивается лучшая совместимость с дру- 
гими языками. Этой директиве должна предшествовать директива .МООЕГ. 
Вот пример использования директивы .ОАТА?: 


„Чата? 
08 5 0ЩР (?) 
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.СО№Т (.соп${) — определяет начало сегмента данных, в котором определе- 
ны константы. При наличии предыдущего сегмента новый сегмент завер- 
шает его. В целях совместимости с другими языками данные должны быть 
в формате, совместимом с принятыми в языках высокого уровня соглаше- 
ниями. Сегмент, определенный директивой .СОМТ, имеет атрибут «только 
для чтения». Этой директиве должна предшествовать директива .МОБЕГ. 


.ЭТАСК (.5фаск) [размер] — определяет начало сегмента стека с указанным 
размером памяти, который должен быть выделен под область стека. Если 
параметр не указан, размер стека предполагается равным 1 Кбайт. При на- 
личии предыдущего сегмента новый сегмент завершает его. Этой директи- 
ве должна предшествовать директива .МОБЕГ. 


.СООЕ (.соде) [имя] — определяет сегмент программного кода и заканчивает 
предыдущий сегмент, если таковой имеется. Необязательный параметр 
имя замещает имя _ТЕХТ, заданное по умолчанию. Если имя не определено, 
ассемблер создает сегмент с именем _ТЕХТ для моделей памяти {1пу, зта11, 
сотрас® и ТТаф или сегмент с именем имя_модуля_ТЕХТ для моделей памяти 
тедтит, 1агде и Виде. Этой директиве должна предшествовать директива 
.МОБЕЕ, указывающая модель памяти, используемую программой. 


„МОБЕЕ (.поде1) модель_памяти [‚соглашение_о_вызовах] [,тип_ОС] [пара- 
метр_стека] — определяет модель памяти, используемую программой. 
Директива должна находиться перед любой из директив объявления сег- 
ментов. Она связывает определенным образом различные сегменты про- 
граммы, определяемые ее параметрами {1пу, $та1 1, сотрас®, тед1ит, 1Тагде, пиде 
или На+. Параметр модель_памяти является обязательным. 


Если разрабатывается процедура для включения в программу, написанную на 
языке высокого уровня, то должна быть указана та модель памяти, которая ис- 
пользуется компилятором языка высокого уровня. Кроме того, модель памяти 
должна соответствовать режиму работы (типу) процессора. Это имеет значение 
для плоской модели памяти, которую можно применять только в режимах .386, 


.486, . 


586, .686. Модель памяти определяет, какой тип адресации данных и команд 


поддерживает программа (пеаг или Таг). Это имеет смысл для команд перехода, 
вызовов и возврата из процедур. В табл. 4.1 демонстрируются эти особенности. 


Таблица 4.1. Параметры моделей памяти 


Модель Адресация Адресация Операционная система Чередование 
памяти кода данных кода и данных 
МУ МЕАВ МЕАК М5-005$ Допустимо 
МАН. МЕАВ МЕАК М5-00$, МАпдом\!$ Нет 

МЕБТУМ РАВ, МЕАК М5-005$, МАпдо\!$ Нет 

СОМРАСТ МЕАВ РАВ М5-00$, М/пдо\!$ Нет 

ГАВСЕ РАВ, РАВ М5-005, МАпдо\!$ Нет 

НОСЕ РАВ. РАВ М5-00$, МИп@о\м5 Нет 

ААТ МЕАВ МЕАВ У/пдоми$ МТ, Мйпдом$ 2000, Допустимо 


МИпдоми$ ХР, МИпдом5 2003 
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Все семь моделей памяти поддерживаются всеми компиляторами МА$М, на- 
чиная с версии 6.1. 

Модель зта11 поддерживает один сегмент кода и один сегмент данных. Данные 
и код при использовании этой модели адресуются как пеаг (ближние). Модель 
1агде поддерживает несколько сегментов кода и несколько сегментов данных. Но 
умолчанию все ссылки на код и данные считаются дальними (таг). 

Модель тед1ит поддерживает несколько сегментов программного кода и один 
сегмент данных, при этом все ссылки в сегментах программного кода по умолча- 
нию считаются дальними (таг), а ссылки в сегменте данных — ближними (пеаг). 
Модель сотрас* поддерживает несколько сегментов данных, в которых использу- 
ется дальняя адресация данных (Таг), и один сегмент кода с ближней адресацией 
(пеаг). Модель Пиде практически эквивалентна модели памяти 1агде. 

Должен заметить, что разработчик программ может явно определить тип адре- 
сации данных и команд в различных моделях памяти. Например, ссылки на ко- 
манды внутри одного сегмента кода в модели 1агде можно сделать ближними 
(пеаг). Проанализируем, в каких случаях лучше всего подходят те или иные моде- 
ли памяти. 

Модель &1пу работает только в 16-разрядных приложениях М$-РО$. В этой 
модели все данные и код располагаются в одном физическом сегменте. Размер 
программного файла в этом случае не превышает 64 Кбайт. С другой стороны, 
модель 11а{ предполагает несегментированную конфигурацию программы и ис- 
пользуется только в 32-разрядных операционных системах. Эта модель подобна 
модели {1пу в том смысле, что данные и код размещены в одном сегменте, только 
32-разрядном. Хочу напомнить, что многие примеры из этой книги разработаны 
именно для модели 11а%. 

Для разработки программы для модели а+ перед директивой .поде! а 
следует разместить одну из директив: .386, .486, .586 или .686. Желательно ука- 
зывать тот тип процессора, который используется в машине, хотя на машинах 
с ше РепИит можно указывать директивы .386 и .486. Операционная система 
автоматически инициализирует сегментные регистры при загрузке программы, 
поэтому модифицировать их нужно, только если необходимо смешивать в одной 
программе 16- и 32-разрядный код. Адресация данных и кода является ближней 
(пеаг), при этом все адреса и указатели являются 32-разрядными. 

Параметр соглашение _о_вызовах используется для определения способа пере- 
дачи параметров при вызове процедуры из других языков, в том числе и языков 
высокого уровня (С++, Разса]). Параметр может принимать следующие значения: 
С, ВАЗТС, РОВТВАМ, РАЗСАЕ, ЗУЗСАН, ЗТОСАЕЕ. При разработке модулей на ассемблере, 
которые будут применяться в программах, написанных на языках высокого уров- 
ня, обращайте внимание на то, какие соглашения о вызовах поддерживает тот 
или иной язык. Более подробно соглашения о вызовах мы будем рассматривать 
при анализе интерфейса программ на ассемблере с программами на языках высо- 
кого уровня. 

Параметр тип_ОС равен 0$_005, и на данный момент это единственное поддер- 
живаемое значение этого параметра. 
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Наконец, последний параметр параметр_стека устанавливается равным 
МЕАВЗТАСК (регистр 5$ равен 05, области данных и стека размещаются в одном и том 
же физическом сегменте) или РАВЗТАСК (регистр 55 не равен 0$, области данных 
и стека размещаются в разных физических сегментах). По умолчанию принима- 
ется значение МЕАВЗТАСК. Рассмотрим примеры использования директивы .МООЕ!: 


„тюбе] Е]а&, с 


Здесь параметр {1а{ указывает компилятору на то, что будет использоваться 
32-разрядная линейная адресация. Второй параметр с указывает, что при вызове 
ассемблерной процедуры из другой программы (возможно, написанной на дру- 
гом языке) будет задействован способ передачи параметров, принятый в языке С. 
Следующий пример: 


моде] Тагде, с, Рагзфаск 


Здесь используются модель памяти 1агде, соглашение о передаче параметров 
языка С и отдельный сегмент стека (регистр 5$ не равен 05). 


‚тоде] тед1ит. разса1 


В этом примере используются модель пед1ит, соглашение о передаче пара- 
метров для Разса| и область стека, размещенная в одном физическом сегменте 
с данными, 
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Программа, написанная на ассемблере МАЗМ, может состоять из нескольких 
частей, называемых модулями, в каждом из которых могут быть определены один 
или несколько сегментов данных, стека и кода. Любая законченная программа на 
ассемблере должна включать один главный, или основной (та), модуль, с кото- 
рого начинается ее выполнение. Основной модуль может содержать программ- 
ные сегменты, сегменты данных и стека, объявленные при помощи упрощенных 
директив. Кроме того, перед объявлением сегментов нужно указать модель памяти 
при помощи директивы .МООЕ. Поскольку подавляющее большинство современ- 
ных приложений являются 32-разрядными, то основное внимание в этом разделе 
мы уделим именно таким программам, хотя не обойдем вниманием и 16-разрядные 
программы, которые все еще используются. Начнем с 16-разрядных программ. 

В следующем примере показана 16-разрядная программа на ассемблере, в ко- 
торой используются упрощенные директивы ассемблера МА$М: 


обе] $та11, с : эта директива указывается до объявления 


; сегментов 
.5$фаск 1008 : размер стека 256 байт 
.дафа ; начало сегмента данных 
; данные 
.соде : здесь начинается сегмент программ 


ма1п: 
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: команды ассемблера 

еп ма1п 

епа 

Здесь оператор еп4 та1п указывает на точку входа та1п в главную процедуру. 
Оператор епд закрывает последний сегмент и обозначает конец исходного текста 
программы. В 16-разрядных приложениях М$-00$ можно инициализировать 


сегментные регистры так, чтобы они указывали на требуемый логический сег- 
мент данных. Листинг 4.1 демонстрирует это. 


Листинг 4.1. Пример адресации сегментов в программе М$-00$ 


моде] Тагде 
„Чата 

$1 ОВ “ТЕЗТ $ТВ1№@$" 
.соде 

оу АХ. @дафа 
моу 05, АХ 
Теа ОХ. $1 
оу АН, ЭН 
16 211 

тоу ах, 4с00Н 
1ё 211 
епа 


Здесь на экран дисплея ВЫВОДИТСЯ строка $1. При ПОМОЩИ следующих команд 
В сегментный регистр 0$ помещается адрес сегмента данных, указанного директи- 
вой .Чафа: 


тоу АХ. @дафа 
мои 05, АХ 


Затем строка $1, адресуемая через регистры 05:0Х, выводится на экран с исполь- 
зованием прерывания 9Ъ функции 21ъ М$-РО$. Попробуйте закомментировать 
проанализированные две строки кода и посмотреть на результат работы программы. 

Для 32-разрядных приложений шаблон исходного текста выглядит иначе: 


.моде] Н1аф 
.$Фаск 
Чата 

: данные 
„сое 

ма1п: 


: команды ассемблера 

епд тма1п 

епд 

Основное отличие от предыдущего примера — другая модель памяти (11а1), 
предполагающая 32-разрядную линейную адресацию с атрибутом пеаг. 

Как видно из примера, «классический» шаблон 32-разрядного приложения со- 


держит область данных (определяемую директивой .да{а), область стека (дирек- 
тива .5{аск) и область программного кода (директива .с0де). Может случиться 
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так, что 32-разрядному приложенизо на ассемблере потребуется несколько от- 
дельных сегментов данных и/или кода. В этом случае разработчик может создать 
их с помощью директивы ЗЕВМЕКТ. Директива $ЕСМЕМТ определяет логический сег- 
мент и может быть описана следующим образом: 


имя ЗЕСМЕМТ список атрибутов 

имя Е№05 

Замечу, что директива ЗЕСМЕМТ может применяться с любой моделью памяти, 
не только Та{. При использовании директивы ЗЕбМЕМТ потребуется указать ком- 


пилятору на то, что все сегментные регистры устанавливаются в соответствии 
с моделью памяти а*. Это можно сделать при помощи директивы АЗЗЦМЕ: 


АЗЗИМЕ С5:ЕЫАТ, ОЗ:ЕЬАТ. 55:РЬАТ. ЕЗ:ЕРЫАТ. Е$:ЕВКОВ, 65 :ЕВКОВ, 


Регистры Е5 и 65 программами не используются, поэтому для них указывается 
атрибут ЕКВОК. 

Сейчас мы рассмотрим программный код 32-разрядной процедуры на ассемб- 
лере (она называется _5е9_ех), в которой используются два логических сегмента 
данных. Процедура выполняет копирование строки $гс, находящейся в сегменте 
данных 4а1а1, в область памяти 45% в сегменте данных Фа{а2 и содержит один 
логический сегмент программного кода (соде зедтет®). 

Успокою читателей, незнакомых с принципами работы процедур (они рассмот- 
рены далее в книге): в данном случае нас будет интересовать код внутри процедуры 
_$е4_ех (команды, находящиеся между директивами _$6е9_ех ргос и _5е9_ех епар). 
Исходный текст программного кода процедуры _5е9_ех представлен в листинге 4.2. 


Листинг 4.2. Использование двух логических сегментов данных в 32-разрядной процедуре 


.586 

„тюде] Пае 

оре1оп сазетар: попе 

Зафа1 зедтепе 
$гс 0В "Тезф ТВ То Сору" 
]Леп ЕЦУ $-5$гс 

Чафа1 епа$ 

Чара? зедтейе ри Т1с 
45 ОВ 1еп+1 0УРС'+') 

аа? епа$ 

сое зедтете 

_$е9_ех ргос 

а$зите С5:ЕЕАТ,0$:ЕГАТ, $$:ЕЁАТ. ЕЗ:РЕАТ, Р5:ЕККОВ. 6$ :ЕККОВ 
Де ЕЗГ. оЁ+еф афа1 

оу ЕОГ. о|15еф Чаба2 


с1а 

оу СХ. Теп 

гер  моу$б 

оу ЕАХ. отТзеф Чафа2 
ге 
_$е9_ех епар 

сое епа$ 


епа 
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При использовании модели а доступ к данным осуществляется по 32-раз- 
рядному смещению, поэтому смысл показанных ниже команд, загружающих ад- 
реса логических сегментов (а заодно и адреса строк $гс и 95+) в регистры ЕЗТ и ЕОТ, 
думаю, понятен: 


моу ЕТ. о5еф дафа1 
тоу ЕОГ. оР5еф дафа2 


Группа следующих команд выполняет копирование строки $гс в 451, при этом 
регистр СХ содержит количество копируемых байтов: 


с1а 
моу СХ. 1еп 
гер тоузЬ 


В регистре ЕАХ возвращается адрес строки-приемника 45%. Обращаю внимание 
читателей на то, что никакой инициализации сегментных регистров не требуется, 
поскольку это делается при помощи директивы .тоде1 а%. Еще один важный мо- 
мент: программа, использующая модель Та, выполняется в одном физическом 
сегменте, хотя логических сегментов может быть несколько, как в нашем случае. 

Работоспособность процедуры легко проверить, вызвав ее из программы на 
\У!5иа] С++ МЕТ (нужно только включить объектный файл процедуры в проект 
приложения). Исходный текст приложения приведен в листинге 4.3. 


Листинг 4.3. Программа, вызывающая процедуру зед_ех 


#1асТиде <$Е41о.1> 
ехбегп "С" спаг* зед_ех(\014): 
17 матп(уота) 


{ 
рилпеЕ("ЕХТЕВМАЕ МОБИЕЕ ЕХАМРЕЕ: %5\п”. $е9_ех()): 
гефигп 0: 


} 


Здесь процедура $е9_ех является внешней, поэтому объявлена как ежфеги. 
Результатом выполнения программы будет строка на экране дисплея 


ЕХТЕВМАЕ МОБУГЕ ЕХАМРЕЕ: Тез ТЕМ То Сору+ 


Организация 
вычислительных 
ЦИКЛОВ 





Большинство программ, независимо от того, на каком языке они написаны, в про- 
цессе работы требуют изменения линейной последовательности выполнения 
операторов и перехода на другие ветви программного кода. В языках высокого 
уровня, таких, например, как С++ или Разса|, существуют специальные опера- 
торы, позволяющие выполнять ветвление программ, в то время как на языке 
ассемблера для организации переходов требуется писать специальный код. 
Подобные операторы или группы операторов называют логическими структура- 
ми. Принципиально, существует два типа логических структур, на основе которых 
можно создать все остальные логические выражения и вычислительные алгоритмы: 


» Структура, основанная на сравнении каких-либо величин и выборе ва- 
рианта продолжения программы в зависимости от результата сравнения. 
Такую логическую структуру можно описать выражением «если А, то В, 
иначе С». В языках высокого уровня ее аналогом является оператор 1$ ... е1<е. 
Кроме того, существуют и расширенные варианты оператора 1+1... е15е, на- 
пример $м1%сН .. сазе. 


® Структура, в основе которой лежит алгоритм повторяющихся вычислений. 
Такой алгоритм выполняется при соблюдении определенных условий, ко- 
торые проверяются в начале или в конце каждой итерации. Такие логиче- 
ские структуры в языках высокого уровня реализованы как операторы 
ие, 40 .„. мне, Гог, гереа* .. ипё11 ит. д. 


Логические структуры языков высокого уровня придают особую гибкость 
и мощь этим языкам и позволяют относительно легко строить самые сложные 
алгоритмы. А как обстоят дела с языком ассемблера, ведь здесь нет подобных 
операторов? Несмотря на отсутствие подобных операторов, ассемблер обладает 
довольно мощными командами, позволяющими строить любые сколь угодно 
сложные логические структуры, в том числе и такие, которые довольно трудно, 
а иногда и невозможно реализовать в языках высокого уровня. 


62 — Глава 5 » Организация вычислительных циклов 


Хочу сразу же оговориться: мы не будем брать во внимание псевдомакросы 
логических структур, такие, как .1Г и .ИНШЕ, включенные в популярные языки 
ассемблера (в данном случае МАЗМ). Псевдомакросы имитируют логические 
структуры высокого уровня, например 1+ .. е1<е, но значительно уступают им по 
возможностям, хотя и улучшают читабельность кода. Если внимательно по- 
смотреть на программный код макросов, то вы увидите, что они содержат коман- 
ды ассемблера, которые вполне можно написать самостоятельно. Кроме того, 
псевдомакросы скрывают механизм операции, что может быть полезно для про- 
граммирования, но не для изучения алгоритмов функционирования. По зтим 
причинам я сознательно отказался от использования псевдомакросов и макро- 
расширений ассемблера при рассмотрении программного кода. 

Посмотрим, как можно создать логические структуры на языке ассемблера 
и использовать их в программах. В подавляющем большинстве случаев для соз- 
дания логических структур и выражений на ассемблере, таких, например, как 
1# .. @5е, ие и так далее, требуется два условия: 


» установить один или несколько битов в регистре флагов процессора; 


» проверить состояние бита (группы битов) с помощью команд условного 
перехода и передать управление на соответствующую ветвь программы. 


Большинство команд ассемблера после выполнения устанавливают биты ре- 
гистра флагов определенным образом, поэтому у программиста есть довольно 
широкий выбор возможностей для организации вычислительных алгоритмов 
и логических структур. Естественно, необходимо учитывать особенности выпол- 
нения той или иной команды, поскольку можно получить совершенно неожидан- 
ные побочные эффекты. 

Для передачи управления можно использовать и команды безусловного пере- 
хода; мы рассмотрим такую возможность позже. 

Таким образом, для построения вычислительных алгоритмов необходимо ана- 
лизировать состояние битов регистра флагов ЕЁЬАб$ центрального процессора. 
Девять из 16 бит регистра являются активными и определяют текущее состояние 
машины и результатов выполнения команд. Многие арифметические команды 
и команды сравнения изменяют состояние флагов. Напомню назначение отдель- 
ных битов регистра флагов: 


® СЕ (Саггу Нав — флаг переноса) — содержит значение переносов (0 или 1) 
из старшего разряда при арифметических операциях и некоторых операци- 
ях сдвига и циклического сдвига; 


® РЕ (Рагцу Раб — флаг четности) — проверяет младшие 8 бит результатов 
выполнения операций над данными. Нечетное число битов приводит к уста- 
новке этого флага в 0, ачетное — в 1. Не следует путать флаг четности с битом 
контроля на четность; 


» АЕ (АихШагу Саггу Рав — дополнительный флаг переноса) — устанавли- 
вается в 1, если арифметическая операция приводит к переносу четвер- 
того справа бита (бит 3) в регистровой однобайтовой команде. Данный 
флаг имеет отношение к арифметическим операциям над АЗСП-символа- 
ми и к полям, содержащим десятичные упакованные числа; 
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1Е (2его Наё — флаг нуля) — устанавливается после выполнения арифме- 
тических команд и команд сравнения. Ненулевой результат операции при- 
водит к установке этого флага в 0, а нулевой — к установке флага в 1. Этот 
флаг проверяется при помощи команд условного перехода фе и }?7; 


$Е ($11 Наё — знаковый флаг) — устанавливается в соответствии со зна- 
ком результата (старшего бита) после выполнения арифметических опера- 
ций: при положительном результате флаг устанавливается в 0, а при отри- 
цательном — в 1. Этот флаг проверяется при помощи команд условного 
перехода 19 и 11; 

ТЕ (Тгар Нав — флаг пошагового выполнения) — если этот флаг установ- 
лен в 1, то процессор переходит в режим пошагового выполнения команд, 
то есть в каждый момент выполняется одна команда под управлением 
пользователя; 


1Е Игхеггаре ЕЁав — флаг прерывания) — при нулевом состоянии этого 
флага прерывания запрещены, а при единичном — разрешены; 


0Е (ОиесНоп Е1а8 — флаг направления) — используется в строковых опера- 
циях для определения направления передачи данных. При нулевом состоя- 
нии команда увеличивает содержимое регистров 5Т (ЕЗТ) и 01 (ЕТ), а при 
ненулевом уменьшает содержимое этих регистров; 


ОЕ (ОуегЙо\ ЕИая — флаг переполнения) — фиксирует арифметическое пе- 
реполнение, то есть перенос в старший бит или из старшего (знакового) би- 
та при знаковых арифметических операциях. 


Чаще всего в программах используются флаг переноса СЕ, флаг знака 5, флаг 


нуля 7Е, немного реже — флаг четности РЕ, флаг направления ОЕ, флаг переполне- 
ния 0Е и флаг дополнительного переноса АЕ, Еще реже, преимущественно в специ- 
альных случаях, используются флаги ТЕ и 1Е. 


Рассмотрим некоторые примеры, демонстрирующие методику выполнения 


условных переходов в программах. 


5.1. Условные переходы и ветвления 


Организацию ветвлений в программах на ассемблере лучше всего объяснить на 
примере. В следующем фрагменте программного кода выполняется переход на 
метку пех{ при равенстве нулю содержимого регистра ЕСХ. Равенство нулю содер- 
жимого ЕСХ определяется при помощи команды стр, которая воздействует на фла- 
ги АР, СЕ, ОЕ, РЕ, ЗЕ и 7Е: 


стр ЕСХ. 0 
32  пеж 
обработка ситуации, когда ЕСХ не равен 0 


пех*: 


обработка ситуации. когда ЕСХ равен 0 
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Если ЕСХ содержит нулевое значение, то команда стр устанавливает флаг нуля 
Е в единицу. Команда ]2 проверяет флаг 7 и, если он равен 1, передает управле- 
ние на адрес, указанный в ее операнде, то есть на метку пехё. Фактически данный 
фрагмент программного кода реализует логическую структуру 11, анализирую- 
щую условие ЕСХ = 0. 

Этот пример демонстрирует один из типичных вариантов организации ветв- 
лений с использованием команды спр. В данном случае эта команда устанавливает 
или сбрасывает флаг 7Е, в зависимости от равенства или неравенства нулю содер- 
жимого регистра ЕСХ. Состояние флага анализируется командой ]2 пех, после чего 
осуществляется переход на одну из двух возможных ветвей программного кода. 
Большинство команд процессоров Пие| воздействуют на флаги, что позволяет за- 
действовать их для организации довольно сложных вычислительных алгоритмов. 

Наиболее часто для организации ветвлений используются команды сравне- 
ния (стр, 1е$1), а также арифметические (а09, зи6 и др.) и логические команды 
(апа, ог, хог). Например, команда {е5+ выполняет операцию логического «И» над 
двумя операндами и в зависимости от результата устанавливает флаги $Е, 2Е и РГ. 
При этом флаги 0Е и СЕ сбрасываются, а флаг АЕ имеет неопределенное значение. 
Очень важно то, что команда 1е5% не изменяет ни одного из операндов. Ее очень 
удобно использовать для анализа отдельных битов сравниваемых величин, как 
в этом примере: 


тезф АХ. 1 
ле в а 


Здесь анализируется нулевой бит регистра АХ. Если он установлен в 1, то флаг 
Е устанавливается в 0 и выполняется переход на метку 5141 _+е5*. 

Ассемблер поддерживает большое количество команд условного перехода, ко- 
торые осуществляют передачу управления в зависимости от состояний регистра 
флагов. При этом следует учитывать некоторые особенности использования та- 
ких команд. В подавляющем большинстве случаев команды условных переходов 
оперируют флагами, установленными в результате сравнения числовых величин. 
Типы данных, над которыми выполняются арифметические операции и опера- 
ции сравнения, определяют выбор команд: беззнаковые или знаковые. Типичны- 
ми примерами беззнаковых данных являются символьные строки, имена, адреса 
и натуральные числа. Многие числовые значения могут быть как положительны- 
ми, так и отрицательными. 

Например, если регистр АХ содержит 110001108, а ВХ — 000101108, то для без- 
знаковых данных значение в АХ будет больше ВХ, а для знаковых — меньше. Пере- 
чень команд условных переходов для беззнаковых данных приведен в табл. 5.1. 


Таблица 5.1. Команды условных переходов для чисел без знака 


Мнемоника Описание Проверяемые флаги 
2Е/32. Переход, если равно/нуль 2Е 
МЕДА Переход, если не равно/не нуль 2Е 
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Мнемоника Описание Проверяемые флаги 
ЗА/)МВЕ Переход, если выше/не ниже или равно 2Е, СЕ 

ЗАЕ/ЭМВ Переход, если выше или равно/не ниже СР 

ЗВ/ЗМАЕ Переход, если ниже/не выше или равно СР 

ЗВЕ/ЗМА Переход, если ниже или равно/не выше СЕ, АР 


Любую проверку можно выполнить с помощью одного из двух мнемониче- 
ских кодов. Например, команды 3 и дпае генерирует один и тот же объектный 
код, хотя мнемоническое обозначение команды 5 понять легче, чем дпае. 

Перечень команд условных переходов для знаковых данных приведен в табл. 5.2. 


Таблица 5.2. Команды условных переходов для чисел со знаком 


Мнемоника Описание Проверяемые флаги 
3Е/32. Переход, если равно/нуль 7Е 

ЭМЕ/ЛЗМ2 Переход, если не равно/не нуль 2Е 

25/2№МЕ Переход, если больше/не меньше или равно 2Е, ЗЕ, ОР 

ЭСЕЗМЕ Переход, если больше или равно/не меньше $Е, ОР 

ЗЫ/2МСЕ Переход, если меньше/не больше или равно $Р, ОЕ 

ЛЕ/ЗМС Переход, если меньше или равно/не больше 2Е, $Е, ОР 


Обратите внимание на то, что команды перехода для условий равно или нуль 
(4е/]2) и не равно или не нуль (3пе/)п2) присутствуют в обеих таблицах для без- 
знаковых и знаковых данных. Состояние равно/нуль не зависит от знака числа. 

Помимо проверок на равенство-неравенство операндов, очень часто требуется 
анализировать и другие флаги. Все такие проверки представлены в табл. 5.3. 


Таблица 5.3. Команды условных переходов для специальных проверок 


Мнемоника Описание Проверяемые флаги 
5 Переход, если число отрицательно $Е 
3№5 Переход, если число положительно $Е 
х Переход, если есть перенос СЕ 
МС Переход, если нет переноса СЕ 
20 Переход, если есть переполнение ОЕ 
в] Переход, если нет переполнения ОЕ 
ЗР/РЕ Переход, если есть паритет РЕ 
ЗМРДР Переход, если нет паритета РЕ 


Еще одна команда условного перехода проверяет равенство содержимого ре- 
гистра СХ нулю. Эта команда необязательно должна располагаться непосредст- 
венно за арифметической командой или командой сравнения. Команда ]сх2 мо- 
жет быть помещена в начало цикла, где она проверяет содержимое регистра СХ. 
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5.2. Команда безусловного перехода }тр 


При выполнении команды безусловного перехода )тр;, независимо от состояния 
флагов процессора, программа продолжает выполняться с новой ветви. При этом 
новый адрес команды загружается в регистр-счетчик команд Е1Р и выполнение 
программного кода продолжается с этого адреса. 

В языке ассемблера новое место, откуда продолжается выполнение програм- 
мы, в большинстве случаев обозначается меткой, которую процессор преобразует 
в исполнительный адрес. Если переход происходит в текущий сегмент, то смеще- 
ние метки загружается непосредственно в регистр-счетчик команд Е1Р. Если же 
метка находится в другом сегменте кода, то адрес сегмента дополнительно загру- 
жается в регистр (5. Для преобразования метки в вид сегмент:смещение использу- 
ются три формата команды дптр: 

Зир $Погф целевой_адрес 

Эр пеаг рёг целевой_адрес 

тр таг рёг целевой адрес 

Здесь целевой адрес — адрес команды, которая будет выполняться после пере- 
хода. Вот несколько примеров команды упр: 

)тр 1аБе]1 —; адрес команды. которая будет выполняться при 

; Переходе. находится в текущем сегменте команд 


Этр пеаг рёг 1аБе?1 : адрес следующей команды находится 
; в текущем сегменте команд 


Эр зНоге 1а6е!1 : адрес команды. которая будет выполняться 
при переходе. находится в диапазоне 
: -128 - +127 


Эр Таг рёг 1а6е]1 ; адрес команды. которая будет 
: выполняться при переходе, находится 
: в другом сегменте 


Рассмотрим операторы, указанные перед целевым адресом. Оператор $Погё 
указывает на то, что нужно сделать переход на метку в диапазоне от —128 до +127, 
начиная от адреса следующей команды. В этом случае к содержимому регистра 
указателя команд Е1Р прибавляется 8-разрядное целое число. 

Оператор пеаг рёг указывает на метку в текущем сегменте, при этом к регистру 
указателя команд Е1Р прибавляется 16-разрядное смещение. Наконец, оператор 
Таг рёг указывает, что необходимо сделать переход на метку в другом сегменте. 
В этом случае сегментная часть адреса метки загружается в регистр ($, а сме- 
щение — в Е1Р. 

Рассмотренные нами модификации команды )пр являются классическими для 
16-разрядных приложений и берут свое начало от «времен М$-ОО$5», когда 
отдельный сегмент кода не мог использовать пространство памяти больше чем 
64 Кбайта, а для создания больших программ требовалось определенным образом 
компоновать несколько сегментов кода и данных. 

Любое современное приложение является 32-разрядным и оперирует с линей- 
ным пространством адресов размером до 4 Гбайт. При разработке ассемблерных 
программ, как упоминалось в главе 3, используется модель памяти Ё1а%, а это 
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означает, что программа занимает непрерывную область адресов, в которой раз- 
мещаются данные и код. По этой причине любые команды адресуются 32-разряд- 
ным смещением в пространстве адресов программы. 

При запуске 32-разрядного приложения все сегментные регистры устанавли- 
ваются в одно и то же значение. Для программистов, работающих с программами 
в 2О$5, 32-разрядное \/т4до\и5-приложение может напоминать СОМ-файл, по- 
скольку в таком файле можно работать только со смещениями. В 32-разрядных 
приложениях все метки и переходы считаются ближними (пеаг рЁг) в диапазоне 
адресов 4 Гбайт. 

Команду пр можно использовать не только для безусловного перехода в сег- 
менте программного кода, но и для организации ветвлений. Для этого можно 
применить один из ее форматов, показанных далее: 

Эр гед16 

Эр гед32 

Эр мог@ рег [ге916] 

Эр дмога рёг [гед32] 

Здесь 7её1б (теё32) — один из 16- или 32-разрядных регистров. Для первых 
двух форматов команд из списка адрес, по которому передается управление, дол- 
жен находиться в одном из этих регистров. 

Если используется 32-разрядный регистр (7её32), то адрес команды, на кото- 
рую передается управление, также является 32-разрядным. Этот формат коман- 
ды тр характерен для 32-разрядных \/!40\5-приложений. 

Последние два формата команды ]тр используют механизм косвенной адреса- 
ции, при этом регистр содержит адрес ячейки памяти, в которой находится адрес ко- 
манды, получающей управление. Проиллюстрируем вышеизложенное примерами: 


`соде 
Ы: 
хог ЕОХ, ЕОХ 
Теа Е5Т, 11 
др ЕЗ! 
В этом примере в регистр ЕЗ1 помещается смещение метки |1, после чего с по- 
мощью команды пр Е51 управление передается на эту метку. 


„Чака 


Табе] _о{4зеё 00 11 
.соде 
(1: 

хог ЕОХ. ЕОХ 


1еа ЕТ, Табе] _о{+ её 
Эир @нога рёг [Е5Г] 
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В этом примере в регистр Е51 помещается адрес переменной 1аБе]_о{Р5е\, в то 
время как сама переменная 1аБе1_о{Р5её содержит адрес метки (1. Команда дир 
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@иога рег [ЕЗТ] в этом случае передает управление на метку |1. 


Как видно из примеров, использование в качестве операндов регистров или 
ячеек памяти придает команде безусловного перехода большую гибкость, чем 
применение прямого смещения, что позволяет создавать ветвления и переходы 
в программе. Далее мы рассмотрим несколько примеров таких ветвлений. 

Следующее 16-разрядное приложение, исходный текст которого показан в ли- 


стинге 5.1, выводит на экран строки $1, $2 и $3. 


Листинг 5.1. Вывод трех символьных строк на зкран 


„тюде] $та11 
.5Фаск 1000 
„Дафа 
$1 08 ОН. бай. "З5%г1пд 1$" 
$2 08 09й. бай. “"Зёглта 2$" 
$3 ОВ 091. бап. "З&г4ид 3$" 
заггау 1аБе] мога 
ОМ $1 
0М $2 
0и $3 
пит ОМ 0 
ТаБе1_аггау Табе] мога 
0 [1 


. @дата 
‚ АХ 
. АХ 


СХ. 3 
‚ Табе] _аггау 


‚ Пим 


УТ. ВХ 


Эр мог р\г [$1] 
медде: 
тис 
1оор 


пит 
пех 


Ц: 

Теа 0%. $1 
оу АН, 9 
11 21 


: массив, в котором хранятся адреса строк 
; Ти $2 


; индекс в адресе перехода команды тр 
; массив адресов меток 

; адрес метки 11 | 

: адрес метки 12 

: адрес метки 13 


: счетчик цикла -> СХ 
: адрес массива меток 


; индекс перехода -> ВХ 

: умножить на 2 для правильной адресации 
; меток в массиве Табе] _аггау 

: сформировать адрес перехода 

: для команды др 

: перейти по адресу, находящемуся 

; в регистре $Т (Ё1 или 12) 


инкремент индекса переходов. 


; повторить цикл 


°; фрагмент кода при переходе на метку 11 
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тр медде : вернуться в цикл 
12: : фрагмент кода при переходе на метку 12 
Теа 0Х. $2 

оу АН, ЭП 

1% 21 

Эр медде 
13: : фрагмент кода при переходе на метку 13 
1Леа ОХ. $3 

тоу АН. ЭП 

11 218 


моу АН. 11 ; ожидать ввода любого символа 
1 21 


тоу АХ. 4с00И ; завершение программы 
1% 21 

еп  зфагё 

епд 


В этой программе продемонстрирована техника использования команды без- 
условного перехода тр для организации трех ветвлений по адресам, определяе- 
мым метками (1, (2 и 13. Адрес перехода команды )пр формируется в регистре 51 
следующим образом: вначале в 51 загружается базовый адрес массива меток 
Табе] _аггау, после чего к нему прибавляется смещение, кратное двум (метки |1 - #3 
имеют двухбайтовый адрес). Затем из сформированного таким образом адреса 
извлекается смещение одной из меток и выполняется переход на соответствую- 
щую ветвь программы. Например, для получения смещения метки (2 необходимо 
к адресу ТаБе1_аггау прибавить значение 2 (индекс пит = 1). После выполнения 
программы на экране должны отобразиться строки: 

Ук 1 

З4гтд 2 

$&г1пд 3 

Как видно из примера, команду безусловного перехода тр можно применить 
для организации ветвлений в программе в зависимости от значения каких-либо 
параметров. Рассмотрим еще один, довольно сложный пример, в котором коман- 
да пр используется для организации ветвлений и фактически моделируется ло- 
гическая структура высокого уровня $м14сН .. сазе языка С++ (или оператор сазе 
языка Разса|), обладающая очень большими вычислительными возможностями. 
В языке ассемблера довольно сложно реализовать такую структуру, и один из 
вариантов реализации, который мы рассмотрим, базируется на использовании 
команды пр. 

Пример представляет собой 32-разрядную процедуру (она называется _сазе_1). 
В качестве входного параметра процедура принимает целое число из диапазона 
0-2, а в регистре ЕАХ возвращает адрес строки, соответствующий значению пара- 
метра. Принципы организации процедур мы рассмотрим в следующих главах, 
сейчас же акцентируем наше внимание на работе программного кода процедуры 

га-” 1, не вникая в детали ее взаимодействия с другими частями программы. 
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Для извлечения единственного параметра используется регистр ЕВР, а сам па- 
раметр для выполнения дальнейших манипуляций помещается в регистр ЕВХ. Ис- 
ходный текст процедуры представлен в листинге 5.2. 


Листинг 5.2. Ассемблерный аналог конструкции сазе 


.686 


„моде РТае 
орЁ1оп саземтар: попе 


„дата 


$1 ОВ "5Ег1тд 1". 0 
$2 ОВ "5Ег1тд 2". 0 
$3 08 "5ёг1ид 3", 0 
егг 08 "]псоггес® рагатефег!". 0 


Табе] _аггау Табе] дмога 


: массив меток. в котором будут 


: находиться смещения 
; меток (1. 12 и (3 


00 ЗЩР (?) 
.соде 
_сазе_1 ргос 
ризп  ЕВР 
ет ЕВР. ЕЗР 
тоу ЕВХ. Чиог@ рг [ЕВР+8] 


: извлекаем параметр (номер строки) 


: и сохраняем его в регистре ЕВХ 


: адрес массива меток -> ЕЗ1 
: заполняем массив меток смещениями 
: меток 11. 12 и 13 


сохраняем в регистре ЕАХ смещение 
метки для выхода из процедуры 


: в случае ошибки 


; Поскольку для адресации 


; используются двойные слова, 
: умножаем номер строки на 4 


; значение учетверенного параметра 


: не должно превышать 8 (номер строки 
: лежит в диапазоне 0-2) 


: верхнее значение меньше 8? Если 


; да, следующая проверка 


: нет. параметр превышает значение 2. 


; выйти из процедуры с ошибкой 


; Параметр не является отрицательным 


: числом? Если 


; нет. продолжить выполнение 


; процедуры 


; да. параметр вне диапазона, выйти 


; С ошибкой 


Теа ЕЗТ, Табе] _аггау 
тоу [Е$1]. отР5её 11 
пу [Е$1+4]. оффеф 12 
пу [Е$1+В]. оРзее 13 
1еа  ЕАХ, егг_ех1% ; 
$ ЕВХ. 2 
стр ЕВХ. 8 
Ле пехё1 
р  ЕАХ 

пехЕ1: 
стр ЕВХ, 0 
39е 9ее_5%г1пд 
Змр ЕАХ 

че_$г1п9д: 


; параметр находится в нужном 


; диапазоне. получить адрес 
: соответствующей строки и выйти из 
; процедуры 


стоуде ЕАХ. [Е$1З[ЕВХ) 


тр 
п: 


ЕАХ 


: сюда передается управление при 
: значении входного параметра. 
: равном 0 
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]Теа ЕАХ. $1 : адрес строки $1 -> ЕАХ 
тр ех1+ : выход из процедуры 
|2: : сюда передается управление при 
; значении входного параметра. 
:; равном 1 
Теа ЕАХ. $2 : адрес строки $2 -> ЕАХ 
р ехи : выход из процедуры 
13: ; сюда передается управление при 
: значении входного параметра. 
; равном 2 
Теа ЕАХ. $3 : адрес строки $3 -> ЕАХ 
р  ехи : выход из процедуры 
егг_ех1%: ; сюда передается управление 
: при возникновении ошибки 
Теа ЕАХ. егг ; адрес сообщения об ошибке -> ЕАХ 
ех1{: 
рор ЕВР 
ге 
_сазе_1  епдр 
епа 


Анализ работы процедуры начнем со строк 


1еа — ЕЗГ. Табе] _аггау 

ту  [Е5Г]. о1#75е №1 

моу — [Е51+4]. отзеё 12 

оу  [Е51+В]. оРзе 13 

Как и в предыдущем примере, вначале заполняем массив меток смещениями 
используемых ветвей программы. Поскольку 32-разрядные приложения работа- 
ют со смещениями, равными двойному слову, то наш массив 1абе1_аггау состоит 
из трех двойных слов, в которых и сохраняются смещения меток (1.1, (2 и 13. Все 
эти действия и выполняют четыре команды, показанные выше. 

Следующая команда помещает в регистр ЕАХ смещение метки, куда должно пе- 
редаваться управление в случае ошибки: 


1еа — ЕАХ. егг_ех1& 
Для передачи управления в нашей процедуре используется команда 
тр ЕАХ 


Она принимает в качестве операнда регистр (в данном случае — ЕАХ), содержа- 
щий смещение команды, куда передается управление. 

С помощью следующей команды устанавливается смещение одной из меток 
(1, Е? или 13), в которую должно передаваться управление при корректном зна- 
чении параметра процедуры: 


$11 ЕВХ. 2 
Фрагмент программного кода, в котором выполняется проверка параметра на 


принадлежность диапазону 0-2, думаю, понятен и в объяснениях не нуждается. 
Если полученный параметр корректен, то выполняется команда 


стюуде ЕАХ. [ЕЗТ(ЕВХ] 
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Остановимся на работе этой инструкции ассемблера более подробно. Описа- 
ние группы команд, к которой принадлежит стоуде, приводится далее в этой гла- 
ве, но в нашем случае эта инструкция выполняет две функции: 


® анализирует результат предыдущей операции (флаг 5Е); 


® если $Р = 1, то в регистр ЕАХ помещается смещение одной из меток (11, 12 
или 13). Само смещение находится по адресу, равному сумме адресов мас- 
сива 1ае]_аггау (регистр ЕЗГ) и индекса строки (регистр ЕВХ). 


Подобную процедуру при желании можно усовершенствовать и использовать 
для организации ветвлений в программах на ассемблере. 


5.3. Организация циклов 


Очень часто условные переходы используются при программировании циклических 
операций, или циклов, когда обрабатывается группа элементов. Количество итера- 
ций (прохождений) в цикле чаще всего определяется количеством обрабатывае- 
мых элементов, хотя это и не обязательно. Цикл может закончиться в одном из 
двух случаев: 


» выполнены все итерации; 
® обнаружено условие, согласно которому должен произойти выход из цикла. 
Рассмотрим следующий пример: пусть необходимо подсчитать количество 

символов в строке. Условимся, что такая строка оканчивается нулем, и будем ис- 

пользовать этот факт как признак конца цикла. Вот фрагмент программного кода, 
реализующий этот алгоритм: 
„дата 
$1 ОВ "АВСОЕЕб”. 0 
.соде 


оу АЁ. 0 
Леа $1, $1 
пех: 
стр Бубе рёг [$11. 0 
3е ехи 
Лис 51 
11с А 
ур пеж 
ех1{: 


Проанализируем этот фрагмент кода. В качестве счетчика элементов исполь- 
зуется регистр А|, в который перед началом вычислений помещается 0. Для ана- 
лиза элемента на равенство нулю нам понадобится адрес строки или, что одно 
и то Же, адрес первого элемента строки. Значение адреса помещается в регистр $1. 
Таким образом, к элементу строки можно получить доступ по его адресу, опреде- 
ляемому парой регистров 05 : $1. В каждой итерации анализируется признак кон- 
ца строки с помощью команды 


стр БУе рёг [$11. 0 
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Если признак конца строки обнаружен, то происходит выход из цикла, Если 
элемент строки не равен 0, то к счетчику элементов в регистре АЁ прибавляется 1, 
а в регистр $1 загружается адрес следующего элемента строки при помощи команды 


Тис $1 


Далее цикл повторяется. Как видно из примера, цикл заканчивается по усло- 
вию (достигнут конец строки). 

Если известно заранее количество итераций в цикле, то признаком окончания 
цикла является выполнение всех итераций. В следующем примере подсчитывает- 
ся количество вхождений символа А в строку $1. Размер строки определяется кон- 
стантой 1еп, поэтому можно использовать это значение для инициализации счет- 
чика цикла: 


„дата 


$1 ОВ "АВСАЕРСАСЕВА" 
1еп ЕДУ $-$1 

.соде 

оу ОХ. 1еп 

оу АЁ. 'А’ 

хог В. В 

Леа 51. $1 

пех: 


стр Буфе рег [$1]. АЁ 
}е тс соимег 
сопе1пие: 

ее 0х 

х ехи 

тс $1 

Эр пех 

1пс_соипфег: 

Тис В 

тр сопё1пие 


ех1%: 


Посмотрим, как работает этот код. Поскольку количество итераций заранее 
известно и равно 1еп, можно загрузить это значение в регистр 0Х и по окончании 
каждой итерации уменьшать содержимое БХ на 1. Выход из цикла произойдет при 
значении ОХ, равном 0. Количество обнаруженных в строке символов А запомина- 
ется в счетчике символов, в качестве которого используется регистр ВЕ (началь- 
ное значение равно 0). 

В самом цикле выполняется сравнение значения текущего символа с содержи- 
мым регистра А+. Если обнаружено совпадение, то есть проверяемый элемент ра- 
вен А, то регистр ВЁ инкрементируется: 


стр Буе рёг [$1]. А 
34е ‘тс _соитег 


1ис_соипфег: 
11с В 
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В нащем последнем примере использовался счетчик цикла на регистре В+. В язы- 
ке ассемблера для организации циклов с заранее определенным количеством ите- 
раций очень удобно применять команду 100р, специально предназначенную для 
подобных целей. 

Команда 100р выполняет декремент содержимого регистра СХ (ЕСХ), и если оно 
не равно нулю, то осуществляется переход на указанную метку вперед или назад 
в диапазоне от —128 до +127 байт. Содержимое регистра СХ (ЕСХ) рассматривается 
как целое число без знака. Перед использованием команды 100р в регистр СХ (ЕСХ) 
нужно поместить счетчик итераций. Команда 100р является последней в цикле 
и анализирует содержимое счетчика: как только оно становится равным нулю, 
происходит выход из цикла. 

Следующий пример демонстрирует в общих чертах методику использования 
команды 100р: 


. дата 


соитег ОМ 5 
.соде 
хог АХ. АХ 
ту СХ, сошмег ; счетчик итераций -> СХ 
пехё: 
1ис АХ ; инкремент регистра АХ 
1Тоор пеж : следующая итерация 


После окончания цикла регистр АХ будет содержать значение 5. Команду 100р 
можно представить ее функциональным аналогом, состоящим из других команд, 
как показано в этом примере: 


. Чата 


соитег ОМ 5 
.соде 

хог АХ. АХ 

му СХ. соиег : счетчик итераций -> СХ 
пех: 

11с АХ ; инкремент регистра АХ 

дес СХ ; декремент регистра СХ 

)сх2  $Кр ; если СХ = 0. выйти из цикла 

тр пех ; следующая итерация 
$К1р: 


Если вместо команды )схг в этом фрагменте кода применить 2, то исходный 
текст будет выглядеть так: 


. Дафа 
соитег ПМ 5 
.соде 
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хог АХ. АХ 


ту СХ. сошфег ; счетчик итераций -> СХ 
пех: 

1ис АХ : инкремент регистра АХ 

дес СХ ; декремент регистра СХ 

02  пеж : если СХ = 0. выйти из цикла. 


: иначе следующая итерация 


Модификациями команды 100р являются команды 100ре/1оорг и 1оорпе/1оорпг. 
Рассмотрим вначале команду 100ре/100р2. Обозначения 1ооре и 100рг представля- 
ют собой синонимы и относятся к одной и той же команде. Эта команда обладает 
дополнительными возможностями по обработке циклов. Она выполняет декре- 
мент содержимого регистра СХ (ЕСХ), и если оно не равно 0 и флаг 2Е установлен 
в 1, то выполняется переход на указанную метку вперед или назад. 

Рассмотрим пример использования команды 100ре. Это простое 16-разрядное 
приложение, которое выводит на экран дисплея строку без начальных пробелов 
(листинг 5.3). 


Листинг 5.3. Вывод строки без начальных пробелов на экран 


„тоде] зта11 
.дафа 
$1 ов" $4г1пд ми Теад1пд БЛапк$ !$" 


1еп Е0/ $-$1 
159 ОВ "ВТапк $г1пд! $” 


„.соде 
$фаг{: 
моу АХ. @даа 
ту 0$. АХ 
Теа 5Т. $1 ; адрес строки -> $1 
дес $1 : декремент адреса для организации цикла 
ЮУ СХ. 1еп : размер строки -> 6Х 
му А. '' ; шаблон для сравнения -> АЕ 
пех: 
тис $1 ; переход к адресу следующего элемента 
стр уе рёг [$1]. АЁ : сравнить элемент строки с пробелом 
1ооре пехё : повторять. пока не будет обнаружен символ. 
у : отличный от пробела. 
: Либо не будет достигнут 
; конец строки 
стр СХ. 0 : был достигнут конец строки? 
3е {а11 : да. строка состоит из пробелов, 
: вывести соответствующее сообщение 
ЮУ ОХ. $1 : нет. в строке есть другие символы, 
: поместить адрес первого символа. 
: отличного от пробела. в регистр ОХ 
ЗАои: 
поу АН. 9 : отобразить сообщения 
11% 21и 
ту АН, Ш 
11% 2 


продолжение „7 
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Листинг 5.3 (продолжение) 
оу АХ. 40008 


тие 211 
#а11: 

Теа ОХ. м9 

пр УПом 

ета $фаге 

епд 


Перейдем к анализу команды 1оорпе/1оориг. Отличие этой команды от 100ре/100рг 
состоит в том, что цикл выполняется, пока выполняется условие 2 = 0. Обозна- 
чения 1оорпе и 100рп2 являются синонимами и относятся к одной и той же команде. 
Пример использования команды 100рпе ‘приводится в листинге 5.4. Как ив пре- 
дыдущем примере, это 16-разрядное приложение, которое выводит на экран дис- 
плея часть строки, следующей за символом + (то есть 5%г1пд 2). 


Листинг 5.4. Вывод на экран части строки после символа + 


„де зта}1 
. Фата 
$1 ОВ "5ёг1тд 1+54г1т9 2$" 
1еп ЕСИ $-$1 
$9 ОВ “Сваг + по Роипд!$" 
„соде 
$Фагс: 
оу АХ. @дата 
МОУ 05. АХ 
Теа УГ. $1 
дес $1 
оу СХ. еп 
оу АЕ. '+' 
пех: 
тис $1 


стр  Буе р [$1]. АЁ 
Тоорпе пехё 


стр СХ. 0 

де {а11 

ЮУ ОХ, $1 
ЗВом: 

МОУ АН. 9 

Ия 211 

ЮУ АН. 11 

11 211 

ЮУ АХ. 40008 

11% 21, 
{а11: 

]еа ОХ. м9 

р Иом 

епа $фагё 

епа 


Как видно из примеров, команда 100р и ее модификации очень удобны для ор- 
ганизации вычислительных алгоритмов, поскольку избавляют программиста от 
необходимости дополнительного кодирования и проверки условий. Последняя 
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команда, которую мы рассмотрим, является модификацией обычной команды 
100р, но предназначена она для работы с двойными словами. Такая команда очень 
полезна при разработке 32-разрядных приложений, которые в большинстве слу- 
чаев оперируют двойными словами. 

Эта команда обозначается как 100р4, и основное ее отличие от команды 100р со- 
стоит в том, что в качестве счетчика цикла используется регистр ЕСХ, содержимое 
которого в конце каждой итерации уменьшается на 4. Напомню, что двойное сло- 
во занимает в оперативной памяти 4 байта, а счетчик ЕСХ содержит размер обла- 
сти памяти в байтах. Адрес следующего обрабатываемого элемента отстоит от те- 
кущего на 4 в сторону увеличения или уменьшения, в зависимости от алгоритма 
задачи. Команда 100р9 оперирует с теми же флагами, что и 100р. Должен заметить, 
что команда 100р4 не включена в ранние модели процессоров [пе]. 

В качестве примера выполнения цикла с использованием команды 100р4 при- 
веду 32-разрядную процедуру, выполняющую поиск в массиве целых чисел пер- 
вого элемента, меньшего —100. В случае удачного поиска процедура возвращает 
значение этого элемента в регистре ЕАХ, в случае неудачи — 0 в этом же регистре. 
Исходный текст процедуры (она называется _100р4 ех) приведен в листинге 5.5. 


Листинг 5.5. Поиск первого элемента массива, меньшего -—100 


.586 
„тюде] ТТа% 
орЕТоп сазетар: попе 
„дата 
а1 00 312, -45. 91. -16. -377 : сканируемый массив 
1еп ЕСИ $-а1 ; размер массива в байтах 
.с04е 
_Лоорд_ех ргос 
оу  ЕСХ. 1еп : размер массива в байтах -> ЕСХ 
г Ех. 2 ; преобразовать размер в двойные слова 
1еа  ЕЗГ, а1 : адрес первого элемента -> Е5] 
пу  ЕАХ. -100 : шаблон для сравнения -> ЕАХ 
пех: 
стр  ЕАХ. [50 : сравнить элемент массива 
: с содержимым регистра ЕАХ 
39е Тоипа : число в массиве меньше -100. 
; закончить программу 
а99 ЕЗГ. 4 : число больше -100. перейти 
; к следующему элементу массива 
Тоора пехё ; следующая итерация 
р  поё_Роипа : массив проверен. чисел меньше -100 нет 
Тоипа: 
у  ЕАХ. [Е$1] : значение элемента массива -> ЕАХ 
р ех\ ; выйти из процедуры 
пое_Гоипд: 
му  ЕАХ. 0 ; при неудачном поиске в регистр ЕАХ 
: помещается 0 
ех1: 
ге 


_1оор9_ех епар 
епд 
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Исходный текст процедуры несложен и в дополнительных объяснениях не 
нуждается, нужно лишь помнить, что процедура оперирует двойными словами, 
и указывать следующий адрес на 4 больше предыдущего. 
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До сих пор мы рассматривали различные варианты реализации условных перехо- 
дов и ветвлений в программах безотносительно к тому, быстро или медленно бу- 
дет работать тот или иной фрагмент кода. В большинстве случаев программист 
обычно не задумывается над производительностью работы приложения, учиты- 
вая то, что современные аппаратные средства обеспечивают довольно приличный 
уровень быстродействия и без специальных усилий со стороны разработчика 
программного обеспечения. 

Однако в целом ряде случаев производительность программы выходит на пер- 
вое место, а система команд процессоров [ле] Реп ит, особенно для последних 
моделей, позволяет ее повысить. В этом разделе мы рассмотрим некоторые во- 
просы, связанные с повышением эффективности программ. 

Быстродействие программы в значительной степени определяется алгоритмом 
вычислений, а также количеством ветвлений и переходов. Кроме этого, большое 
влияние на производительность программы оказывают характер ветвлений и ор- 
ганизация циклических вычислений там, где они необходимы. 

В идеале высокопроизводительное приложение должно состоять из линейно 
выполняющегося программного кода, без ветвлений и переходов. В этом случае 
процессор Ние] Реп ит мог бы обеспечить наибольшее быстродействие програм- 
мы, поскольку не понадобился бы механизм прогнозирования ветвлений, отни- 
мающий приличную часть процессорного времени в цикле выполнения команды. 

Поскольку избежать ветвлений и переходов в программах вряд ли когда-ни- 
будь удастся, то можно, по крайней мере, уменьшить их количество или оптими- 
зировать сами ветвления. Разработчики фирмы Пие| включили в систему команд 
процессоров Репиит ряд новых команд, предназначенных для оптимизации 
переходов в программах. Лучше всего показать работу таких команд на примерах 
и одновременно изучить их синтаксис. 

Для повышения производительности программ фирма [пе] включила в новые 
поколения процессоров, начиная с Репит И, ряд команд, позволяющих эффек- 
тивно управлять ветвлениями программы. К таким командам относятся команды 
её СС, стоуСС и ГстоуСС, где СС — одно из условий (е, пе, 1е ит. д.). 

Остановимся на синтаксисе этих команд и начнем с команд $е* СС. Вот их 
формат: 

5е{СС гед8 

$е%СС тет . 

Здесь зе СС — одна из следующих команд: зефе/зефт, зе{1 /зефпде и т. д., а тея8/ 
тет8 — единственный операнд команды, представляющий собой 8-разрядный 
регистр, например А+, АН, ВЁ ит. д., или байт памяти. Если заданное в команде 
условие выполнено, то в операнд помещается значение 1, если ложно — 0. Коман- 
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ды 5е%СС анализируют соответствующие флаги, установленные предыдущими 
ассемблерными инструкциями. 
Проиллюстрируем сказанное примером: 


стр АГ. 0 
зеёе ВЕ 


Если после выполнения команды стр обнаружено равенство нулю содержимо- 
го регистра А! то флаг 72 будет установлен в 1. Следующая команда зе{е анализи- 
рует состояние этого флага и помещает в регистр ВЕ значение 1. Если бы в А( со- 
держалось число, отличное от нуля, то в регистр ВЕ было бы записано значение 0. 

Перечень команд 5е{ СС приведен в табл. 5.4. 


Таблица 5.4. Команды $е СС 


Мнемоника Описание Проверяемые флаги 
ЗЕТАЕ/5ЕТМВ Установить, если выше или равно/не ниже СЕ 

ЗЕТЕ/ЗЕТ2. Установить, если равно/нуль 2Е 

ЗЕТМЕ/5ЕТМИ Установить, если не равно/не нуль 2Е 

ЗЕТВ/ЗЕТМАЕ Установить, если ниже/не выше или равно СР 

ЗЕТВЕ/5ЕТМА` Установить, если ниже или равно/не выше СР, 2Е 


ЗЕТУЗЕТМСЕ Установить, если меньше/не больше или равно $Р, ОЕ 
ЗЕТСЕ/ЗЕТМЬ Установить, если больше или равно/не меньше $Р, ОР 
ЗЕТС/5ЗЕТМЕ Установить, если больше/не меньше или равно 7Е, ЗЕ, ОР 


ЗЕТЗ Установить, если $Е = 1 ЗЕ 
ЗЕТМ$ Установить, если $Р = 0 $Е 
ЗЕТС Установить, если СР = 1 СЕ 
ЗЕТМС Установить, если СР = 0 СЕР 
ЕТО Установить, если ОР = 1 ОЕ 
ЗЕТМО Установить, если ОР = 0 ОЕ 
ЗЕТР/ЗЕТРЕ Установить, если РЕ = 1 РЕ 
ЗЕТМР/5ЕТРО Установить, если РЕ = 0 РЕ 


Команды её СС очень удобны при организации вычислений по условию. При 
этом можно избавиться от ненужных команд переходов, что дает выигрыш в быст- 
родействии. Рассмотрим следующий пример. Пусть в массиве целых чисел требу- 
ется найти первое число, лежащее между 50 и 100. Эту задачу можно рещить с по- 
мощью процедуры 11п4_пит, исходный текст которой показан в листинге 5.6. 

В этой процедуре просматривается массив целых чисел а1, адрес которого на- 
ходится в регистре Е5Т. Для поиска нужного элемента используется обычный ал- 
горитм, в котором каждый элемент массива проверяется дважды: является ли он 
меньшим или равным числу 100 (команды стр @могд рёг [Е$Т], 100 и ]1е пех*1), 
а также большим или равным 50 (команды стр Чмога рёг [Е5Т]. 50 и 19е Роипа). 
Применение нескольких команд 5её СС позволяет уменьшить число ветвлений 
программы. 
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Листинг 5.6. Поиск первого элемента массива, находящегося в диапазоне 50-100 


.686 
„мо4е] #1а+ 
оре1оп сазетар: попе 
„Дафа 
а1 0034. -53. 88, 13. 67 
1Теп ЕДУ $-а1 
.соде 
11а пит ргос 
1еа — ЕЗГ. а! : адрес массива -> Е$1 
тоу  ЕСХ. 1еп ; раэмер массива в байтах -> ЕСХ 
$№г  ЕСХ. 2 : преобразовать в количество двойных слов 
пех: 
стр  @мога рёг [ЕЗГ], 100 : элемент массива меньше или равен 100? 
Ле пехи ; да. выполним следующую проверку 
Зр  пехё адаг : число больше 100. перейти 
: к следующему адресу 
пехё : 
стр @мог@ рёг [Е5Г]. 50 ; элемент массива больше или равен 50? 
39е —Тоипа : да. элемент обнаружен. поместить его 
; в регистр ЕАХ и выйти из процедуры 
пехс_а@4г: ; перейти к следующену элементу массива 
а94  ЕЗ!. 4 
дес  ЕСХ : декремент счетчика 
уп2  пеж : если ‘содержимое ЕСХ не равно 0. 
: перейти к. следующей итерации 
у  ЕАХ. 0 ; цикл завершен, требуеный элемент 
: отсутствует. помещаем в ЕАХ значение 0 
р ехи | 
Тоипа: 
у  ЕАХ. [Е$П : найденный элемент -> ЕАХ 
ех1{: 
ге 
1пб_пит епар 
ета 


В листинге 5.7 представлен модифицированный вариант этой же процедуры, 
в которой в той или иной форме используются команды $е*СС. 


Листинг 5.7. Модифицированный с использованием команд $е(СС вариант листинга 5.6 


.686 
„ое Р1а+ 
ор 1оп сазетар: попе 
„ата 
а1 00 34. -53. 88. 13, 67 
]1еп ЕОУ $-а1 
950 08? : вспомогательные переменные 
1100 08 ? 
‚.с0де д... 
11а пит ргос - 
1еа  ЕЗГ. а1 : адрес нассива -> ЕЗ1 
му  ЕСХ, 1еп ; размер массива в байтах -> ЕСХ 
иг ЕСХ. 2 : преобразовать в количество двойных слов 
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пех: . 
стр  @мога ру [Е$1]. 50 —; элемент массива больше или равен 50? 
зефде 950 ; если да, установить переменную 950 в 1, 


; иначе установить 950 в 0 
стр  Фмога рёг [ЕЗГ], 100 :; элемент массива меньше или равен 100? 
ее 1100 ; если да, установить переменную 1100 в 1, 
; иначе установить 1100 в 0 


му  АЁ, 950 ; сравнить 950 и 1100 
стр АЁ. 1100 
де Гоипд : если переменные равны. элемент обнаружен 
; и поиск заканчивается 
а64  ЕЗГ. 4 ; нет, 950 не равен 1100. продолжить поиск 
дес  ЕСХ 
м2  пеж 
тои  ЕАХ, 0 : цикл закончен. нужный элемент не найден, 
:; помещаем в регистр ЕАХ значение 0 
др ехи 
Тоипа: 
тоу  ЕАХ, [Е$1] ; значение обнаруженного элемента -> ЕАХ 
ех1{: 
ге 
Нипа_пит епбр 
ета 


В исходном тексте изменения выделены жирным шрифтом. Смысл изменений 
достаточно очевиден, замечу лишь, что нам удалось избавиться от двух команд 
условных переходов и сделать программный код более линейным. При указан- 
ных значениях элементов массива по завершении процедуры регистр ЕАХ будет 
содержать число 88. 

Следующая группа команд, которую мы рассмотрим, включает команды стоуСС. 
Формат этой команды выглядит так: 


СТОУСС $гс. 45 


Здесь СС — одно из условий (е, пе, пг, 1е ит. д.), згс может быть 16- или 32-раз- 
рядным регистром, а 45 — 16- или 32-разрядным регистром или ячейкой памяти. 
Команда проверяет условие и, если оно выполняется, копирует содержимое 46 
в 575. Если условие не выполняется, операнд $7с остается без изменений. Не- 
болыпой пример поможет лучше понять способ использования команд стоуСС: 


„Чака 
ор1 0 ? 
‚.соде 


стр АХ. 0р1 
стоуде АХ, ор1 


Если содержимое регистра АХ больше или равно переменной 0р1, то ор1 копи- 
руется в АХ. Если же содержимое АХ меньше 0р1, то оба операнда остаются неиз- 
менными. 

Команда стоуСС весьма полезна при разработке быстрых алгоритмов и оптими- 
зации ветвлений. Перед применением команды стоуСС необходимо проверить, 
поддерживается ли она процессором, что легко сделать с помощью команды сри14. 
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Рассмотрим еще один пример программы, в которой присутствуют коман- 
ды условных переходов, и попробуем ее усовершенствовать. Пусть требуется 
определить большее из двух целых чисел. Если использовать обычные команды 
ассемблера, то этот алгоритм можно реализовать с помощью следующей последо- 
свательности инструкций: 


.дафа 
пит -06 12 
мий? 706 11 
.соде 


261С 

"иоу ЕАХ. пит 

зюу ЕОХ. пита 

стр ЕАХ. ЕОХ 

39 пом 9 памё 

"иоу ЕВХ. ЕБХ 

эпр ех& 
пом? :9_ пита: 

"июу ЕВХ. ЕАХ 
ех{: 


Этот код сравнивает два целых числа — пит] и питё, помещая большее из них 
в регистр ЕВХ. Здесь присутствует команда условного перехода д, выполняющая 
переход на другую ветвь программного кода, если пит! больше пит2. Для модифи- 
кации программного кода воспользуемся командой сто\1. Новый вариант исход- 
ного текста программы выглядит так: 


„Чата 
пит 1196 12 
пийё 1100 11 
.соде 


-тоу — ЕАХ. пит 


“ЮУ  ЕБХ. пит 
стр  ЕАХ, ЕБХ 
сюу1 ЕАХ, ЕБХ 


моу  ЕВХ. ЕАХ 


Проанализируем программный код. В регистр ЕАХ помещается первое число 
(пит1), а в ЕОХ — второе (пит2). После выполнения показанной ниже команды срав- 
нения будут установлены соответствующие флаги: 


стр ЕАХ. ЕОХ 


Следующая команда помещает в регистр ЕАХ содержимое ЕДХ, если число в Е0Х 
больше числа в ЕАХ, и оставляет содержимое ЕАХ без изменения, если число в ЕАХ 
больше числа в ЕБХ: 


стоу1 ЕАХ, ЕБХ 


Наконец, содержимое регистра ЕАХ помещается в регистр ЕВХ. Из этого фраг- 
мента видно, что ветвлений и переходов нет. Перед использованием команды 
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стоуСС необходимо проверить, поддерживается ли она данным типом процессо- 
ра. Такую проверку можно выполнить с помощью команды сри1а. 

Рассмотрим еще один пример. Пусть требуется найти модуль (абсолютное 
значение) числа. Используя обычную команду условного перехода де, можно 
сделать это с помощью следующего программного кода: 

.дафа 


пит? 00 -18 
.соде 


о | ЕАХ. пит1 


стр ЕАХ. 0 

35е ехи 

пед  ЕАХ 
ех1\: 


Как видно из исходного текста, после команды стр программный код разветв- 
ляется. Этого можно легко избежать, если использовать команду сто\1. Более бы- 
стродействующий код выглядит так: 

„дата 

пит? 60 18 

.собе 


У | ЕАХ. пит} 


оу  ЕБХ. ЕАХ 
пед  Е0Х 
стр  ЕАХ, 0 


стоу1 ЕАХ. ЕБХ 


В нашем последнем примере представлен окончательный вариант процедуры 
{1и4_пит, в которой используются команды 5еЁСС и стоуСС (листинг 5.8). 

Ранее мы уже достаточно подробно анализировали исходный текст процедуры 
1пд_пит, поэтому остановимся лишь на последних изменениях (они выделены жир- 
ным шрифтом). Как видно из листинга, в случае равенства переменных 950 и 1100 
команда стоуе ЕАХ, [Е51] копирует искомое значение в регистр ЕАХ. Следующая 
инструкция }е ех1* передает управление либо на выход процедуры (флаг 21 = 1), 
либо следующей команде (в данном случае а94 ЕЗТ. 4). Команда стоуе ЕАХ, [ЕЗТ] 
не влияет на состояние флагов, поэтому инструкция де ех1*, фактически, анали- 
зирует флаги, установленные командой стр АЁ, 1100. Как видите, в модифици- 
рованном варианте процедуры осталось всего две команды условных переходов. 

Более-менее сложная программа, помимо условных и безусловных переходов, 
может содержать один или несколько вычислительных циклов. Вычисления или 
другие операции, выполняющиеся циклически, могут повторяться от нескольких 
десятков до сотен миллионов раз, создавая ощутимую нагрузку на память и про- 
цессор. Правильная организация циклов помогает не только повысить произво- 
дительность программы в целом, но и снизить потребление ресурсов. Сейчас мы 
проанализируем, каким образом можно повысить производительность програм- 
мы или процедуры на ассемблере за счет оптимизации циклических вычислений. 
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Листинг 5.8. Поиск элемента массива, находящегося в диапазоне 50-100 
(окончательный вариант) 


.686 
.пюде] Рае 
орЁЛоп сазетар: попе 
„дата 
а1 0634. -93, 95. 13, 7. 1 
]1еп ЕЦ $-а1 
950 08? 
1100.08 ? 
сова 
Ми оут ргос 
ва  ЕЗГ. .а1 
шоу  ЕСХ. 1еп 
г  ЕСХ. 2 
пехе: 
сшр  Флюгд рег $1]. 50 
зе4ее 650 
ср  @югд рег 5]. 100 
зе е 1100 


оу АМ. 950 
сир №, 1100 
соч ВАХ, [Е$1] 
? ее 
#4 ЕГ..4 
426  ЕСХ 
2  веж 
у ГА, 0 
-ех(: 
вое 
"та пилезпар 
епа 


Вначале остановимся на теоретическом аспекте проблемы. В наиболее общем 
виде цикл представляет собой последовательность команд, начинающихся с опре- 
деленной метки и возвращающихся на нее после выполнения этой последова- 
тельности. В псевдокодах ассемблера цикл можно представить так: 

метка: 

инструкции ассемблера 
]тр метка | 

Например, следующая последовательность команд представляет собой про- 

стой цикл: 


хог ЕВХ. ЕВХ 
П: 
инструкции ассемблера 
1пс ЕВХ 
стр ЕВХ. 100000 
де ехи 
др НП 
ех11: 


В этом цикле выполняется увеличение содержимого регистра ЕВХ от 0 до 100 000, 
и при достижении этого значения передается управление на метку ех1+. 
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Проанализируем этот фрагмент кода с точки зрения быстродействия. Его 
нельзя назвать оптимальным, поскольку для анализа условия выхода из цикла 
и самого выхода из цикла используется несколько команд переходов. Для цикла 
с,фиксированным числом итераций проблему оптимизации решить несложно, 
как показано в следующем фрагменте кода; 


`поу ЕбХ. 100000 
Ы: 


инструкиии ассенблера 
Чес ЕБХ 
дир Ш 

ех1{: 


Как видно из этого листинга, значение счетчика цикла помещается в ре- 
гистр Е0Х. Этот фрагмент более эффективен, чем предыдущий. Команда декре- 
мента устанавливает флаг 7Е, когда счетчик становится равным 0, что приводит 
к выходу из цикла, иначе цикл продолжается. Этот фрагмент кода требует мень- 
шего количества команд и будет выполняться быстрее. 

Еще один способ повышения быстродействия циклических вычислений состо- 
ит в том, чтобы по возможности избавиться от ветвлений и условных переходов 
внутри самого цикла. Рассмотрим пример (листинг 5.9). Пусть в массиве целых 
чисел необходимо заменить все отрицательные числа нулями. Это можно сделать 
с помощью 32-разрядной процедуры на ассемблере (назовем ее _5е{0). 


Листинг 5.9. Замена отрицательных элементов массива целых чисел нулевыми значениями 


.686 

люде] Наф 

орЛоп сазетар:попе 

„Чата 
1аггау 00 -73. 931. -89, 92. -5. 67. 30 
1еп ЕСУ $-Таггау 


.с0де 
_$е:0 ргос 
]Леа — ЕЗТ, Таггау ; адрес массива -> Е$1 
тоу  ЕБХ. 1еп ; размер массива (в байтах) -> ЕОХ 
иг ЕБХ, 2 : преобразовать в количество двойных слов 


стр  @мога рег [ЕЗТ], 0; сравнить элемент массива с нулем 
39е по спапде : если больше нуля, оставить без изменения 
оу  Фмог4 рёг [Е51]. 0 ; если меньше нуля, заменить на 0 


по спапде: 
244  ЕЗ, 4 : перейти к следующему элементу 
Чес  ЕБХ ; уменьшить счетчик цикла на 1 
72  пеж ; переход к следующей итерации 
Леа  ЕАХ. Таггау : адрес массива -> ЕАХ 
геё 
_$е%0 епар 


ела 
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В этой процедуре выполняется основной цикл, операторы которого нахо- 
дятся между меткой пех{ и инструкцией )п2 пех{ и образуют тело цикла. В теле 
цикла присутствует команда )де по_сПапде, выполняющая ветвление в зависи- 
мости от результата сравнения. Подобные изменения в последовательности 
выполнения отрицательно сказываются на быстродействии, поэтому попробуем 
избавиться от лишнего перехода. Сделать это можно с помощью команды еде. 
Посмотрим, как будет выглядеть модифицированный вариант процедуры (ли- 
стинг 5.10). 


Листинг 5.10. Модифицированный вариант листинга 5.9, в котором используется 
команда зеве 
. 686 
„ое Е1а* 
орёТоп сазетар: попе 
.даба 
1аггау 00 273. 417. -31, -92, 5. -67. 360 
Теп ЕОУ $-Таггау 


.с04е 
_.$е%0:ргос 
ризи ЕВХ 


1еа  ЕЗГ. Таггау 
“-тоу Е. 1еп 


г ЕХ..2 
пех: 
хог  ЕЗХ. ЕВХ 
сир  @мог@ раг Ё:$1. 0 
зебар В. 


тии]  ЕЗХ. хмогато®г [Е$Г] 
тоу  Чмога рёг ЕЕ$Т1. ЕВХ 


&14 Е. .4 
@с ВХ 
2 ве 
Теа  ЕАХ. Таггау 
рор ЕВХ 
ге 
_$е10 епар 
епа 


Хочу отметить, что даже хорошо оптимизированный цикл иногда не работает 
так быстро, как ожидает разработчик. Для дальнейшего повышения эффектив- 
ности прибегают к так называемому разворачиванию (ипгоШп#) цикла. Этот 
термин означает на самом деле, что цикл должен выполнять больше действий 
в одной итерации для уменьшения количества итераций. Это дает неплохой 
эффект, и сейчас мы рассмотрим два фрагмента программного кода, в которых 
имеет место разворачивание циклов. 

В качестве исходного (неоптимизированного) фрагмента кода возьмем, на- 
пример, копирование данных размером в двойное слово из одного буфера па- 
мяти (обозначим его как $гс) в другой (951). Исходный текст представлен в ли- 
стинге 5.11. 
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Листинг 5.11. Копирование двойных слов без оптимизации 


„дата 


гс 00 345. -65. 12. 99. 369. 267 


1Теп ЕСУ $-$гс 
45+ бО6ЩР (?) 
.соде 


тмоу ЕЗГ. $гс 
тмоу ЕБТ, 95% 
тмоу ЕСХ. Теп 
$йг ЕСХ. 2 


: адрес источника $гс-> Е$] 
; адрес приемника 45% -> ЕВ! 

°; эначение счетчика байтов -> ЕСХ 
: перевести значение счетчика 


: в двойные слова 


ШОУ-БАХ. [Е51] 
а94-Е5Т, 4 
шоу [Е01].ЕАХ 
апа-Е0Т. 4 
вес-ЕСХ 

АУ 


87 


Для разворачивания цикла выполним одновременно копирование двух двой- 
ных слов. Исходный текст оптимизированного фрагмента кода показан в листин- 
ге 5.12 (изменения выделены жирным шрифтом). 


Листинг 5.12. Модифицированный код листинга 5.11 


.дафа 


$гс 00 345. -65, 12. 99. 369. 267 


1Теп ЕСИ $-$гс 
95 бб (3) 
.соде 


тмоу ЕЗТ, $гс 
моу ЕОТ. 4$ 
ппоу ЕСХ, 1еп 
зйг ЕСХ, 3 


‚ 


11: 
мо ЕАХ. [Е$1] 


поуЕВХ, [ЕбТ-+ 4] 
пом [Е017. АХ 


`поу ГЕОГ +:4], ЕВХ : 


ад4:Е$Т, В 
ад9=Е0Т, 8 
вес ЕСХ 
зи2 Табе] 


‚ адрес источника -5ге..>=25$] 

: задрос“ириемника 45$ -> ЕО 

; значение счетчика байтов -> ЕСХ 
; "перевести значение-счетчика 

; В учезверенные слова (два 

; „двойных слова) 


; сохраняем первое двойное слово из 

: пары в регистре -ЕАХ 

: сохраняем вторез дкойное слово в регистртЕВХ 

: понощавм“ первое -двбйнее слово в-регистр ЕП] 
записываем вторае двойное слово “по=адресу 

; в регистре ЕОТ на 4 больше продылуйего 

: пронвигаем адреел истечника и приениина так, чтббы 
‚они уназызали на следующе? двойное -слено 


; переход к следующей итерации или 
; ВЫХОД из цикла 
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Разворачивание позволяет наполовину скомпенсировать снижение-произво- 
дительности программы, в которой используется такой цикл. Если оперировать 
не двумя, а четырьмя двойными словами, то можно развернуть цикл далее. 

Приведу еще один пример разворачивания циклов. Пусть имеется массив из 
10 целых чисел и требуется присвоить элементам массива с четными номерами 
значение 0, а элементам с нечетными номерами значение 1. Если особо не заду- 
мываться над качеством программы, то можно быстро написать фрагмент про- 
граммного кода, представленный в листинге 5.13. 


Листинг 5.13. Обработка четных и нечетных элементов целочисленного массива 
"дата 

1аггау 00 10 дир (0) 

1Теп ЕСИ $-Таггау 


.соде 
тоу ЕСХ, 1еп ; число элементов массива (в байтах) -> ЕСХ 
Теа ЕЗГ. 11 ; адрес первого элемента массива -> ЕТ 
тоу ЕВХ. 2 ‚ помещаем делитель 2 в регистр ЕВХ для 
: определения. четный или нечетный элемент 
пех: 
тоу ЕАХ. ЕСХ : счетчик элементов -> ЕАХ 
Ч1у ЕВХ ; определяем. четный или нечетный 
; порядковый номер у элемента массива 
стр ЕБХ. 0 
Зпе $боге_1 ; если нечетный, присваиваем элементу’ 


; значение 1 
поу ОМОКО РТВ [ЕЗТ]. 0 ; если четный. присваиваем элементу значение 0 
Эпр пехё абаг 
$фоге_1: 
тоу ОМОКО РТВ [Е$Т], 1 
пехё_абаг: ; адрес следующего элемента массива 
а94 ЕЗТ, 4 
}оор пехё 


Данный фрагмент программного кода можно оптимизировать, если обрабаты- 
вать в каждой итерации два двойных слова вместо одного. Модифицируем пре- 
дыдущий пример, поместив программный код в процедуру ипг_1. Исходный текст 
измененной программы показан в листинге 5.14. 


Листинг 5.14. Модифицированный код листинга.5.13 с развовачиванием пикла 
2686 
0691 -Таф 
орлоп саземар: попе 
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иг ЕВХ, 2 
дес ЕВХ 
хог ЕБХ. ЕПХ 
-пехф: 
моу ОМОКОРТА [Е$Т], 0 
моу ОМОРОРТВ [Е51+4)..1 
а94 ЕОХ. 2 
стр Е0ОХ. ЕВХ 
Зае ехм 
а48 ЕЗГ. В 
ар пехг 
-ех1т: 
1еа ЕАХ. таггау 
геё 
_ипг_1 епар 
епб 


Как видите, исходный текст этого фрагмента кода претерпел существенные 
изменения по сравнению с предыдущим примером. Программа стала более ком- 
пактной; повысилась ее производительность, поскольку мы избавились от команд 
деления и одновременно уменьшили число итераций в два раза. 

В каждой итерации обрабатываются одновременно два элемента массива ко- 
мандами 


тоу ОМОВО РТВ [Е$Т]. 0 
тоу ОМОВО РТВ [Е$1+4].1 


‚ В конце каждой итерации содержимое регистра ЕЗТ увеличивается на 8 с помо- 
щью команды а94 ЕЗТ,8, указывая на следующую пару элементов. Количество об- 
рабатываемых пар элементов помещается в регистр ЕВХ: 


тоу ЕВХ, 1еп 
иг ЕВХ. 2 
дес ЕВХ 


Здесь хочу сделать важное замечание. В нашей процедуре обрабатывается 
10 двойных слов, поэтому регистр ЕВХ должен содержать значение 9 для коррект- 
ной работы цикла. Если количество элементов массива будет нечетным, то необхо- 
димо обрабатывать последнее двойное слово вне цикла. Это потребует дополнитель- 
ных команд, но в целом не окажет существенного влияния на быстродействие 
процедуры, особенно при больших размерах обрабатываемых массивов. Напри- 
мер, чтобы обработать 1589 двойных слов, объединив каждые два элемента, необ- 
ходимо выполнить 397 итераций для учетверенных слов и после окончания цик- 
ла обработать одно двойное слово. При желании читатели могут самостоятельно 
разработать подобную процедуру, обрабатывающую произвольное количество 
двойных слов. 

Для организации циклических вычислений очень часто используются коман- 
да 100р и ее модификации. Соответствующие примеры мы рассматривали ранее 
в этой главе. Эта команда очень удобна, поскольку избавляет программиста от 
необходимости постоянно проверять условие окончания цикла. Модификации 
команды 100р, такие, например, как 1ооре и 1оорпе, еще больше упрощают про- 
граммирование циклов. 
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Несмотря на очевидные удобства в применении, команда 100р имеет средние 
показатели производительности. Если на первое место выходит скорость выпол- 
нения программного кода, то команду 100р лучше не использовать, особенно при 
обработке большого числа элементов строк или массивов. В таких случаях жела- 
тельно заменить команду 100р группой команд. Это замечание касается, в первую 
очередь, приложений, разрабатываемых для процессоров Пие| Репиит, посколь- 
ку на более ранних процессорах команда 100р работает быстрее своих программ- 
ных аналогов. 

Вот пример замены команды 100р эквивалентными ей командами: 


дезе: 


дестсх 
12:9е5% 


Что же касается команд 1ооре и 1оорпе, то они работают значительно медлен- 
нее, чем эквивалентный им код, включающий обычные команды процессоров 
шее] Репиит. При очень интенсивных вычислениях команды 100рСС (СС = е, пе, 
2, п2) в программах лучше не использовать. Стандартной эквивалентной замены 
для таких команд не существует, поскольку в каждом конкрётном случае про- 
граммный код может быть уникальным. Рассмотрим вариант замены команды 
1ооре в приведенном ранее примере 16-разрядного приложения (см. листинг 5.3). 

Напомню, что программный код примера выводит на экран строку без началь- 
ных символов пробела. В листинге 5.15 показан исходный текст модифицирован- 
ной программы. 


Листинг 5.15. Модифицированный код листинга 5.3 
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„Часа 
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“оу СХ. Теп 

“оу -АЁ. '' 
тех: 

тс 51 

стр „Бубе рёг [$1], 4. 

пе #7 

ес СХ 

„упр пех 

“тр  №а11 

чу ОХ. 51 
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5.4. Оптимизация кода в процессорах Те! Репбит 91 


1% 21 
оу АН, 11 
1% 21 
моу АХ. 40000 
1 21 

1а11: 
]1еа ОХ. т59 
Эр  $Пом 
еп@  зТаге 
еп4 


В этой программе команда 1ооре заменена следующим фрагментом кода (вы- 
делен жирным шрифтом): 


зле $+7 


дес СХ 
72  пеж 


Как работает эта группа команд? На каждой итерации выполняется поиск 
символа пробела с помощью команды 


стр БУе рг [$1]. А 


Предположим, что обнаружен символ, отличный от пробела. В этом случае ко- 
манда стр устанавливает флаг 2Ё в 0. Следующая команда ]пе $+7 анализирует 
флаг 7Е и передает управление команде, находящейся по адресу со смещением +7 
в сегменте программного кода. Это смещение определяется как разность адресов 
следующей выполняемой команды и текущей. Следующей командой является 


тоу ОХ. $1 


Она загружает адрес оставшейся части строки в регистр 0Х для вывода на эк- 
ран. Эта команда отстоит на 7 байт от выполняемой в данный момент команды. 
Таким образом, команда пе $+7 передает управление по адресу команды 


тоу ОХ. $1 


Если обнаруженный символ является пробелом, то выполняется декремент 
содержимого регистра СХ, и если оно не равно 0, то цикл повторяется. Если стро- 
ка состоит из одних пробелов, то после окончания цикла управление передается 
команде 

р Та! 

Попробуем теперь подобрать аналог программного кода для команды 1оорпе, 
которая используется в программе, отображающей часть строки после знака + 
(см. листинг 5.4). Исходный текст модифицированной программы представлен 
в листинге 5.16. 

Исходный текст фрагмента кода, используемого вместо команды 1оорпе, выде- 
лен жирным шрифтом. Он очень напоминает программный код из предыдущего 
примера, с той лишь разницей, что команда )пе по смыслу программы заменена 
командой де, кроме того, изменилась величина смещения (8 вместо 7). Смещение 
зависит от объема памяти, занимаемого пропусклемымн комаидами, а в этом 
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фрагменте вместо дес СХ используется для разнообразия команда дес (|, занимаю- 
щая объем памяти на 1 байт болыше. 


„Листинг .16. Замена команды [сорпе в“программе из листинга:5.4 
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Помимо рассмотренных простейших вариантов можно разработать и ‘другие 
способы модификации программного кода с командами 1оорСС. Автор надеется, 
что материал этой главы окажет помощь в создании новых, более эффективных 
алгоритмов обработки данных и модификации уже существующих. 


Процедуры на языке 
ассемблера 





В большинстве программ встречаются фрагменты программного кода, которые 
нужно неоднократно выполнять и, следовательно, повторять одну и ту же после- 
довательность команд. Такие фрагменты программного кода целесообразно вы- 
делить из программы, оформив в виде подпрограмм или процедур, и обращаться 
к ним всякий раз, когда основной программе потребуется их выполнение. 

Немного о терминологии. В дальнейшем термины «подпрограмма» и «проце- 
дура» будут использоваться как синонимы (процедура является одной из форм 
реализации подпрограммы). Везде в этой главе и далее будем считать термины 
«подпрограмма» и «процедура» тождественными и полагать, что оба они представ- 
ляют группу команд, заключенных между директивами ргос и епдр. По отношению 
к подпрограмме, или процедуре, остальную часть программы принято называть 
основной или вызывающей программой. Эта глава посвящена принципам разра- 
ботки подпрограмм (процедур) на языке ассемблера. 

Подпрограммы могут находиться как в исполняемом файле основной про- 
граммы, так и в отдельном объектном файле, который включается в файл основ- 
ной программы при помощи компоновщика. Это означает, что исходный текст 
подпрограммы может помещаться в файл с расширением АбМ и компилироваться 
автономно в файл объектного модуля, имеющий расширение ОВЗ. 

Существует еще один способ использования автономных подпрограмм, кото- 
рый нередко применяется в 32-разрядных приложениях УЛ п4о\з: можно создать 
библиотеку динамической компоновки (Рупапис [лик Т16гагу, ОГ.Т.), поместив 
в нее программный код процедуры. В этом случае основная программа сможет 
определенным образом получить доступ к процедуре, находящейся в ОТ.Т.. Соз- 
дание и функционирование РТТ, тесно связано с архитектурой операционных 
систем \/тдо\, что само по себе является отдельной темой, поэтому ограничим- 
ся рассмотрением классического варианта применения подпрограмм с использова- 
нием объектных файлов. 
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Для функционирования подпрограмм большое значение имеет правильное 
использование механизма стековых операций, поэтому прежде всего проанализи- 
руем принципы выполнения таких операций. 


6.1. Организация стека 


Стек представляет собой специальную область памяти, которая служит для вре- 
менного хранения данных и адресов. Для адресации стека используются регистры 
$5:5Р (16-разрядные приложения) и 55:ЕЗР (32-разрядные программы). Регистр 5Р 
(ЕЗР) называется указателем стека и содержит 16- или 32-разрядный адрес по- 
следнего элемента, помещенного в стек. Последнее значение, помещенное в стек, 
извлекается первым. Подобная структура называется ГЛЕО (Газе п, Е! зе Оп — 
прибыл последним, обслужен первым). Стек растет к меньшим адресам, то есть 
последнее значение, поступившее в стек, хранится по наименьшему адресу. 

Несмотря на то что память в процессорах х86 имеет байтовую организацию, 
минимальный размер операнда, которым оперируют команды стековых опера- 
ций, равен слову (2 байта). По этой причине данные в стеке отстоят друг от 
друга на величину, кратную двум. Например, при помещении в стек слова значе- 
ние указателя стека $Р (ЕЗР) уменьшается на 2, при помещении двойного слова — 
на 4 ит. д. При этом младшие байты. операндов помещаются в стек по младшим 
адресам, а старшие байты — по старшим адресам. . 

Для того чтобы поместить какое-либо значение в стек, нужно использовать 
команду ризй. Эта команда в качестве параметра может принимать любой 16- или 
32-разрядный регистр либо ячейку памяти. При этом содержимое указателя сте- 
ка 5Р (ЕЗР) уменьшается на 2 (для слова) или на 4 (для двойного слова). Команда 
допускает один из форматов: 


ризй гед16/гед32 

ризй тет16/тет32 

ризП 5едгед 

ризй илтеа 

Здесь 7теё16/теё32 — один из 16- или 32-разрядных регистров, тет16/тет32 — 
переменная в памяти (16 или 32 разряда), зедтеЕ — один из сегментных регистров 
(С5, 05, ЕЗ), а йитей — непосредственное значение. Команда риз! с непосредствен- 
ным операндом (1ттед) в процессорах ие! Репцит недопустима. 

Существуют специальные модификации команды ризИ. Так, например, для со- 
хранения 16-разрядного регистра флагов процессора в стеке используется коман- 
да ризИТ, а для сохранения 32-разрядного регистра флагов — команда ризП1а. По- 
следняя команда присутствует только в процессорах, начиная с 80386. Наконец, 
существуют специальные форматы команды ризй, позволяющие сохранить в сте- 
ке все регистры процессора: 


» ризпа — помещает в стек все 16-разрядные регистры (АХ, ВХ, СХ, ОХ, $Р, ВР, $1, ОТ); 


® ризпад — помещает в стек все 32-разрядные регистры (ЕАХ, ЕВХ, ЕСХ, ЕОХ, ЕЗР, 
ЕВР, ЕЗТ, ЕОТ). 


Приведу несколько примеров использования команды изв иее модификаций. 
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Предположим, что в стеке находится единственное значение, равное 7ЕЕЗЬ 
(рис. 6.1). 


Младшие Область стека Старшие 

адреса адреса 

памяти - - памяти 
——— =——— 





| 


$Р 
Рис. 6.1. Начальное состояние стека 


Выполним команды 


тоу ВХ. 2СЕ9П 
ризй ВХ 


Команда ризй в этом фрагменте программного кода копирует содержимое ре- 
гистра ВХ в стек, при этом содержимое регистра 5$Р уменьшается на 2 и стек начи- 
нает выглядеть так, как показано на рис. 6.2. 





Младшие Область стека Старшие 
адреса адреса 
памяти памяти 
—— 
ЗР ЗР+2 


Рис. 6.2. Состояние стека после выполнения команды ризп ВХ 


Напомню, что минимальная размерность данных, которыми оперирует стек, 
равна 16 бит, поэтому содержимое регистра 5Р (ЕЗР) не может увеличиться или 
уменьшиться на 1. Это означает, что нельзя поместить в стек или извлечь из стека 
данные размером в 1 байт. Указатель стека увеличивается (уменьшается) на 2 
или 4 (для слова или двойного слова соответственно). Например, после выпол- 
нения следующего фрагмента кода содержимое стека будет таким, как показано 
на рис. 6.3: 


тмоу ЕВХ, 4РЕ91А77В 


ризй ЕВХ 
Младшие Область стека Старшие 
адреса адреса 
памяти памяти 





ЗР Предыдущее 
значение 


указателя 
стека ЗР 


Рис. 6.3. Размещение двойного слова в стеке 


96 Глава 6 » Процедуры на языке ассемблера 


После этой операции указатель стека уменышается на 4, поскольку в него по- 
мещается двойное слово. 

Извлечение данных из стека выполняется с помощью команды рор. При этом 
из стека извлекается слово (двойное слово) и помещается в указанный операнд. 
Эта команда в качестве параметра может принимать любой 16- или 32-разрядный 
регистр или ячейку памяти. При этом содержимое указателя стека $Р (Е$Р) увели- 
чивается на 2 (для слова) или на 4 (для двойного слова). 

Команда рор является зеркальной по отношению к ризВ и использует те же ти- 
пы операндов, что и команда ризй. Кроме того, для извлечения содержимого реги- 
стра флагов из стека имеются команды рор?.(для 16-разрядного регистра флагов) 
и рор! 9 (для 32-разрядного). Для того чтобы восстановить все регистры процессо- 
ра значениями из стека, в систему команд включены инструкции рора (для 16-раз- 
рядных регистров) и рора4 (для 32-разрядных). Например, следующая команда 
извлекает данные, помещенные в стек в предыдущем примере, и запоминает их 
в регистре ЕБХ: 


рор ЕОХ 


После выполнения этой команды регистр ЕОХ будет содержать значение 
АРЕ91А77В, а указатель стека уменьшится на 4 (рис. 6.4). 


Младшие Область стека Старшие 
адреса ° ` адреса’ 
памяти 
——— 





Рис. 6.4. Содержимое стека после выполнения команды рор ЕОХ 


Как видно из предыдущих примеров, стек может обеспечивать временное 
хранение данных. Кроме того, с помощью команд ризй и рор можно организовать 
обмен данными между регистрами и памятью, причем операнды могут иметь раз- 
ный размер. В следующих примерах показана техника использования стека в раз- 
личных операциях: 

оу ЕАХ, 112233440 

ризй ЕАХ 

рор ВХ 

рор СХ 

Здесь команда ризп ЕАХ помещает в стек двойное слово 112233441. После 
выполнения команды рор ВХ из стека извлекается младшее слово, равное 3344}, 
и помещается в регистр ВХ. Указатель стека Е5Р при этом уменьшается на 2. Сле- 
дующая команда рор СХ извлекает из стека старшее слово, равное 11221, и поме- 
щает его в регистр СХ. При этом содержимое регистра Е$Р опять уменьшается на 2. 

„Дафа 

ор [М 77770 

.с0де 
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изн 0$:ор 
рор АХ 


В этом примере в стек помещается значение 16-разрядной переменной ор (ко- 
манда ризй 05:0р), при этом указывается сегмент данных, в котором определена 
переменная (регистр 05). Указатель стека ЗР после выполнения этой операции 
уменьшается на 2. Следующая команда рор АХ извлекает содержимое стека в ре- 
гистр АХ и восстанавливает стек, увеличивая значение $Р на 2. Таким образом, в ре- 
гистре АХ будет содержаться значение 77778. 

Следующий пример демонстрирует применение операций со стеком в 16-раз- 
рядном приложении. Исходный текст программы показан в листинге 6.1. 


Листинг 6.1. Демонстрация стековых операций (16-разрядная версия) 
‚люде] $та11 
„Чата 

пит] Ом '91°’ 

$1 08 "5ТАШЮ 1 $" 

$2 ОВ "“ЭТАШЮ 2 $" 
.соде 
$Фаге: 

поу АХ. @дафа 

тои 05. АХ 

ризй 0$:пит1 

]Леа $1, $2 

ризй $1 

Теа 0%, $1 

тоу АН. ЭП 

11 211 

рор ОХ 

118 21й 

рор 0Х 

хсп9 ОН. 0 

моу АН, 21 

те 211 

хсп9 ОН. 0% 

1% 210 

тоу АХ. 4с001 

т 210 

еп $Фаге 

епа 


Программа достаточно проста — она выводит на экран значения перемен- 
ной пит] и символьных строк $1 и $2, причем вначале отображается содержи- 
мое строки $1, затем — строки $2 и наконец — значение переменной пит1. Сначала 
в стек помещается значение переменной пит] (команда ризй 05:пит1)), затем — 
адрес строки $2: 

ризй 0$: пит1 


1еа $Т. $2 
ризИ $2 
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После этих операций указатель стека уменьшается на 4, а содержимое стека 
становится таким, как показано на рис. 6.5. 


Младшие Область стека Старшие 
адреса адреса 
памяти —— памяти 





ЗР $ЗР +2 Предыдущее 
значение 
указателя 
стека ЗР 


Рис. 6.5. Содержимое стека после помещения данных программы 


Затем программа выводит на экран строку $1: 


Теа ОХ. $1 
поу АН. 9 
1% 218 


После этого из стека извлекается адрес строки $2 и помещается в регистр 0Х. 
Далее строка $2 выводится на экран: 

рор 0Х 

11 211 

К этому моменту в стеке остается значение переменной пит, а указатель стека 
$Р уменьшается на 2. Следующая команда рор ОХ извлекает переменную пит из 
стека и помещает ее значение в регистр 0Х, при этом указатель стека еще раз 
уменьшается на 2. Последующие команды отображают содержимое ОХ на экране 
с учетом порядка размещения байтов в регистре: 

рор 0Х 

хси9 ОН. 0 

тоу АН. 2П 

11 211 

хсп9 ОН. 0. 

11 21й 

Хочу сделать замечание: для временного хранения в стеке данных, представ- 
ленных строками или массивами, используются их адреса или, как их еще назы- 
вают, указатели. Адрес строки (или массива) одновременно является и адресом 
ее первого элемента. Например, адрес строки $1 из предыдущего примера совпа- 
дает с адресом символа 5. 

При выполнении операций со стеком вся ответственность за содержимое стека 
ложится на программиста, поэтому нужно быть очень внимательным. Если ка- 
кое-либо значение помещается в стек во время работы программы, то оно должно 
быть извлечено из стека перед ее завершением либо стек должен быть восстанов- 
лен каким-то другим способом. Несоблюдение этих требований приводит, как 
правило, к краху программы. Точно так же суммарный размер операндов, извле- 
ченных из стека, должен быть равным размеру помещенных в него данных. 
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Хорошо спроектированная программа перед завершением всегда восстанав- 
ливает указатель стека к тому значению, которое было перед началом ее выпол- 
нения. 

Для операций с данными в стеке не обязательно использовать команды ризй 
и рор. Вспомним, что стек представляет собой всего лишь область оперативной 
памяти, поэтому для доступа к данным можно применять обычные команды ас- 
семблера, используя регистровую косвенную адресацию посредством регистра ВР 
(ЕВР). Для доступа к данным стека необходимо поместить содержимое указателя 
стека $Р (ЕЗР) в регистр ВР (ЕВР), после чего указать смещение данных. Следующий 
фрагмент программного кода демонстрирует такой подход (листинг 6.2). 


Листинг 6.2. Доступ к данным в стеке посредством регистра ЕВР (16-разрядная версия) 


„дата 
0р1 ОМ 11490 
ор2 0 0ЕЗ7П 
.соде 


тоу АХ, @дака 

мои 05. АХ 

рип 0$:0р1 

ризи 0$:ор2 

оу ВР, ЗР 

поу АХ, мога рёг [ВР+2] 
оу ВХ, мога рёг [ВР] 


Здесь содержимое переменных ор! и ор2 помещается в стек, причем значение 
ор! оказывается по адресу [5Р+21, а значение ор? — по адресу [5$Р] (рис. 6.6). 


Младшие Область стека Старшие 
адреса адреса 
памяти 





ЗР $Р+2 — Предыдущее 
значение 


указателя 
стека ЗР 


Рис. 6.6. Содержимое стека после размещения переменных ор1 и ор2 


Поскольку после выполнения команды тоу ВР. $Р регистр ВР содержит значе- 
ние $Р, то значение переменной ор] хранится по адресу [ВР+2}, а значение орг — по 
адресу [ВР]. После выполнения последних двух команд данного фрагмента кода 
регистр АХ будет содержать 1149[, а регистр ВХ — ОЕЗ7В. 

При разработке 32-разрядных приложений для процессоров ие! РепИит 
использовать регистр ЕВР для доступа к данным в стеке не обязательно — можно 
напрямую работать с указателем стека ЕЗР. Например, с помощью следующего 
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фрагмента программного кода вычисляется разность операндов ор2 и 0р1, которая 
затем помещается в регистр ЕАХ;: 
.686 
.поде1 11а% 
орёфоп сазетар: попе 
.дафа 
0р1 00 145 
орё 00 98 
.соде 


ризй ор1 
ризН орг 


тоу ЕАХ. Чмога рёг [ЕЗР] —; содержимое ор1 -> ЕАХ 
зиб ЕАХ. Чмога рёг [Е$Р+4] ; орё - 0р1 -> ЕАХ 


В последних двух примерах мы не акцентировали внимание на восстановле- 
нии указателя стека, хотя в ряде случаев применение обычных команд рор может 
оказаться неудобным или невозможным. В таких случаях можно воспользоваться 
еще одним способом восстановления стека — задействовать команду 490: 


а44 ЕЗР. п 


Здесь п — количество байтов, на которое следует продвинуть указатель сте- 
ка $Р (Е5Р). Следующий пример демонстрирует восстановление указателя стека 
после того, как в стек были помещены три двойных слова (12 байт): 


.со4е 

ризп ЕАХ 
ризий ЕВХ 
ризй ЕСХ 


а94  ЕЗР. 12 


Поскольку команды ри! помещают в стек 12 байт (три двойных слова), то для 
восстановления указателя стека следует продвинуть его на это же число в сторо- 
ну увеличения адресов, что и делается с помощью команды ад4. 

Далее мы проанализируем, как используется стек при выполнении подпрограмм. 


6.2. Принципы организации подпрограмм 


Подпрограмма, в зависимости от выполняемых ею функций, может требовать 
передачи из вызывающей программы определенных данных, которые принято 
называть аргументами или параметрами и возвращать в вызывающую програм- 
му результат вычислений. Некоторые подпрограммы могут вообще не принимать 
никаких параметров и не возвращать результат. Чаще всего подпрограмма (про- 
цедура) оформляется так, как показано в следующем фрагменте кода: 


поу АХ. 0 
пом ВХ, 0 
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тр $фаг+ 
а9491 ргос : точка входа в процедуру а991 
1пс АХ 
ге* : возврат в вызывающую программу 
2041 епар 
5461 ргос ; точка входа в процедуру $461 
дес ВХ 
ге ; возврат в вызывающую программу 
$61 епар 
Зфагф: 
са11 а941 ; вызов процедуры а941 
са11 $и651 : вызов процедуры $и61 
Лир $фагё 


Как видно из приведенного фрагмента кода, в начале процедуры (перед пер- 
вой выполняемой командой) должна находиться директива ргос, а после по- 
следней выполняемой команды — директива епдр. Процедура обязательно долж- 
на заканчиваться командой ге*. В одном ассемблерном файле с расширением АЗМ 
можно размещать несколько процедур. 

Точкой входа в процедуру считается директива ргос. В директиве ргос после 
имени процедуры не ставится двоеточие, хотя имя считается меткой и указывает 
на первую команду процедуры. Имя процедуры можно указать в команде перехода, 
и тогда будет осуществлен переход на первую команду процедуры. 

Директива ргос может принимать один из двух параметров: пеаг или Раг. Пара- 
метр пеаг указывает на то, что процедура является ближней, а Гаг указывает на то, 
что процедура дальняя. Если параметр отсутствует, то считается, что процедура 
имеет тип пеаг (поэтому параметр пеаг обычно и не указывается). 

К ближней (пеаг) процедуре можно обращаться только из того сегмента ко- 
манд, где она объявлена, а к дальней (Гаг) процедуре — из любых сегментов ко- 
манд, включая тот, где она объявлена. Для 32-разрядных приложений все вызовы 
процедур считаются ближними. 

Следует отметить, что в языке ассемблера имена и метки, описанные в про- 
цедуре, должны быть уникальными и не должны совпадать с другими именами 
в программе. В языке ассемблера имеется возможность создавать вложенные 
процедуры, то есть процедуры внутри процедур, но особых преимуществ это не 
дает и используется относительно редко. 

Можно обойтись и без явного определения процедуры, пометив первую стро- 
ку программы некоторой меткой, как проиллюстрировано в следующем фрагмен- 
те программного кода: 

тоу АХ. 0 
тоу ВХ. 0 
пех: 

са11 а991 
са11 $и51 
Зар пехё 

2991: : подпрограмма, начинающаяся с метки 

1пс АХ 
ге 
$461: ; подпрограмма, начинающаяся с метки 


дес ВХ 
гет 
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В этом случае отсутствуют директивы ргос и епар и говорят, что подпрограмма 
(процедура) определяется неявно. Подобные записи процедур используются 
редко, поскольку значительно затрудняют анализ исходных текстов и отладку 
программ. Мы не будем применять такое определение процедур, а воспользуемся 
директивами ргос и епар, как было сказано в начале главы. Вызов процедуры вы- 
полняется с помощью команды са11, которая передает управление процедуре, со- 
хранив в стеке адрес возврата в вызывающую программу. Процедура должна за- 
вершаться командой ге\, которая извлекает из стека адрес возврата и возвращает 
управление команде, следующей за командой са11. 

Рассмотрим более подробно механизмы работы команд са11 и ге*. Особое зна- 
чение в механизме вызова процедуры и возврата из нее имеет стек. Поскольку 
в стеке хранится адрес возврата, то процедура, использующая его для хранения 
промежуточных результатов, должна к моменту выполнения команды гей восста- 
новить стек в том состоянии, в котором он находился перед ее вызовом. В этом 
случае говорят, что процедура должна восстановить, или очистить, стек. 

В момент вызова процедуры команда са11 помещает в стек адрес команды, 
следующей непосредственно за са11, уменьшая значение указателя стека 5Р (ЕЗР). 
Команда ге вызываемой процедуры использует этот адрес для возврата в вы- 
зывающую программу, автоматически увеличивая при этом указатель верши- 
ны стека. 

Типы адресации (пеаг или Таг) команд геф и са11 должны соответствовать друг 
другу. Вызываемая процедура может вызвать с помощью команды са11 следую- 
щую процедуру и т. д., поэтому стек должен иметь достаточный размер для того, 
чтобы хранить в нем все записываемые данные. 

Следует сказать, что команда геф не анализирует состояние или содержимое 
стека. Она извлекает из вершины стека слово или двойное слово, в зависимости 
от типа адресации, полагая, что это адрес возврата, по которому передается 
управление. Если к моменту выполнения команды ге{ указатель стека окажется 
смещенным в ту или иную сторону, содержимое вершины стека может пред- 
ставлять все что угодно, поэтому передача управления по этому адресу приведет 
к краху программы. 

Команда са11 может иметь один из перечисленных ниже форматов вызова: 


® прямой ближний (в пределах текущего программного сегмента); 


® прямой дальний (вызов процедуры, расположенной в другом программном 
сегменте); 

® косвенный ближний (в пределах текущего программного сегмента с ис- 
пользованием переменной, содержащей адрес перехода); 

® косвенный дальний (вызов процедуры, расположенной в другом программ- 
ном сегменте, с использованием переменной, содержащей адрес пере- 
хода). 

Тип адресации при вызове процедуры зависит от используемой модели па- 

мяти. Директива .тоде] автоматически устанавливает атрибут пеаг или Таг для 
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вызываемых процедур, при этом модели {1пу, °та11 и сотрас* устанавливают ат- 
рибут пеаг, а модели тедтит, Тагде и пиде — атрибут Гаг. Ассемблер генерирует 
Гаг-вызовы для моделей тедтит, 1агде и Пиде автоматически. Для 32-разрядных 
приложений, использующих модель {1аф, все вызовы процедур считаются ближ- 
ними (пеаг). 

Проанализируем более подробно форматы вызовов команды са11. Если исполь- 
зуется прямой ближний вызов, то команда са11 помещает в стек относительный 
адрес точки возврата в текущем программном сегменте и модифицирует указа- 
тель адресов команд ЕР так, чтобы в нем содержался относительный адрес точки 
перехода в том же программном сегменте. 

Требуемая для вычисления этого адреса величина смещения от точки возвра- 
та до точки перехода содержится в коде самой команды, занимающем 3 байта 
(код операции Е8В плюс смещение к точке перехода). 

Команда са11 прямого дальнего вызова помещает в стек два слова: вначале 
сегментный адрес текущего программного сегмента, затем относительный адрес 
точки возврата в этом программном сегменте. После этого выполняется модифи- 
кация регистров ЕТР и 65: в Е1Р помещается относительный адрес точки перехода 
в том сегменте, куда осуществляется переход, а в (5 — селектор адреса для этого 
сегмента. 

Оба эти значения извлекаются из кода команды, занимающего 5 байт (код 
операции ЭАВ, эффективный адрес вызываемой процедуры и селектор сегмента). 
Для указания прямого дальнего вызова используется директива Таг рёг, которая 
говорит компилятору и компоновщику, что вызов является дальним. 

В листинге 6.3 показан фрагмент программного кода, демонстрирующий даль- 
ний вызов процедуры. 


Листинг 6,3. Демонстрация дальних вызовов процедур (16-разрядная версия) 


лю4де] Тагде 
Чата зедтепт 
$1 ОВ 0аН. бай. "О1гес® Таг са? о? зибг1 Чето !$” 
$2 ОВ 0ай. Оан, "О1гесе Раг са11 о? $и6г2 дето !$" 
дафа епд$ 
сое] зедтепе 
аззите (5:с049е1 
мати ргос ; точка входа в основную программу 
моу АХ. @Чафа 
ту 05, АХ 
са11 Раг рёг $и5г1 : дальний вызов подпрограммы $ибг] 
са11 Раг рёг зибг? :; дальний вызов подпрограммы $и6г2 
: код команды са?1 в обоих 
: случаях: 9А <смещение> <сегмент> 
тоу АН, 11 
1 21 
тоу Ах. 40001 
11 21 
тали епар 


соде1 епб$ продолжение „7 
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Листинг 6.3. (продолжение) 


сое? зедтепе 
аззите (5:соде2 


$ибг1 ргос Таг ; объявление дальней подпрограммы $и6г1 
Леа ОХ. $1 
тоу АН. УП 
17 211 
геё ; команда геф имеет код ОСВИ (возврат из дальней 
; подпрограммы) 
$ибг1 епар 
зибг2 ргос Таг : объявление дальней подпрограммы зи6г2 
Теа ОХ. $2 
моу АН. 9И 
118 211 
ге : команда геё имеет код ОСВА (возврат из дальней 
; подпрограммы) 
$ибг2 епар 
соде2 еп 


Процедуры иг! и $и6г2 находятся в другом сегменте команд той же програм- 
мы и при вызове выводят на экран строки $1 и $2. При выполнении команды са11 
процессор помещает в стек сначала сегментный адрес вызывающей программы, 
а затем относительный адрес возврата, как показано на рис. 6.7. 


Младшие Область стека Старшие 

адреса адреса 

памяти ——- памяти 
-—— -—— 





1 


ЗР ЗР+2 Прадыдущее 
значение ЗР 


Рис. 6:7. Содержимое стека после вызова дальней процедуры 


Поскольку процедура объявлена дальней (атрибут Гаг), то команда ге{ имеет 
код ОСВЬ, отличный от кода аналогичной команды для вызова ближней процеду- 
ры (ОСЗВ), и выполняется по-другому: из вершины стека извлекаются два слова 
и помещаются в регистры ЕТР и 6$, передавая тем самым управление вызывающей 
программе из другого сегмента команд. Для команды возврата из дальней проце- 
дуры существует специальное мнемоническое обозначение ге\Г. 

Рассмотрим косвенный ближний вызов. В этом случае адрес процедуры со- 
держится либо в ячейке памяти, либо в регистре. Это позволяет, как и в случае 
косвенного ближнего перехода, модифицировать адрес вызова, а также осуществ- 
лять вызов без использования метки по известному абсолютному адресу. Сле- 
дующее 16-разрядное приложение иллюстрирует механизм косвенного вызова 
процедуры (листинг 6.4). 
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Листинг 6.4. Демонстрация косвенного вызова процедуры (16-разрядная версия) 
„тоде] зта11 


Чата 
$1 
$2 
адаг1 
адаг2 

.соде 

$фаг*: 

тоу 
МОУ 
са11 


са11 


тоу 
11% 
оу 
11 
$и6г1 
Теа 
МОУ 
17% 
ге 
$и6г1 
$ибг2 
Теа 
оу 
11% 
геф 
$ибг2 
епа 
епа 


ОВ бай. бан. "№еаг 1п@1гесЕ са11 оф $и6г1 !$" 
ОВ баи. бан. "Меаг 1п@1гесе са11 оР зыбг2 !$" 


Ом $ибг1 
Ом зибг2 


АХ. @дафа 
05. АХ 
05: ад4г1 


05: адаг2 


АН. 1И 
21й 

АХ. 40000 
21п 

ргос 

ОХ. $1 
АН. ЭН 
2] 1 


епар 
ргос 
0Х. $2 
АН. ЭП 
2]и 


епар 
зфаг% 


: вы308 подпрограммы зибг] по смещению. 
: расположенному в переменной а9аг1 
; вызов подпрограммы зибг2 по смещению. 
; расположенному в переменной адаг2 


Процедуры $и6г1 и зибг2 с атрибутом пеаг находятся в том же сегменте, что 
и вызывающая программа, а их относительные адреса — в переменных а49г] и адаг2 
в сегменте данных. Процедуры при вызове выводят соответствующие сообщения 
(строки $1 и $2) на экран. 

Косвенный ближний вызов позволяет использовать разнообразные способы 
адресации процедур: 


са11 ВХ 
са11 [ВХ] 


са11[ВХ2 [$1] : 
; в $1 индекс в этой таблице 


{61[$1] : переменная {61 содержит адрес таблицы адресов подпрограмм. 


; адрес подпрограммы находится в регистре ВХ 
; адрес подпрограммы находится в ячейке памяти. адрес 


которой помещается в регистр ВХ 
в ВХ адрес таблицы адресов подпрограмм. 


; в $1 индекс в этой таблице 


В листинге 6.5 приведен исходный текст 16-разрядного приложения, де- 
монстрирующий один из вариантов реализации косвенного ближнего вызова. 
Здесь для вычисления смещения (эффективного адреса) процедуры используются 
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регистры $1 и ВХ, причем в регистре $1 содержится адрес таблицы {61 смещений 
подпрограмм, а регистр ВХ содержит индекс. 


Листинг 6.5. Демонстрация косвенного ближнего вызова (16-разрядная версия) 


‚оде] зта11 
Чафа зедтепу 
{Ь1 Табе] мога 


ОМ $ибг1 ; смещение процедуры $и6г1 
0 зибг2 ; смещение процедуры зи6г2 
Ом зибгЗ ; смещение процедуры $и6гЗ 


$1 ОВ (ан. бай. "№еаг 1пд1гес® са11 $и6г1 дето 2 !$" 
$2 ОВ бай. бан. "Меаг 1па1гесё са] зибг? дето 2 1$" 
$3 ОВ 0ап, бай, "Меаг 1па1гесф са11 зибг3З аетю 2 !$" 
Чафа епд$ 
соде зедтепу 
аззите (5:со4де. 05:дака 


мати ргос 

оу АХ, Чака 

оу 05. АХ 

1еа 51. 151 ; адрес таблицы смещений -> $1 
хог ВХ. ВХ : начальное смещение -> ВХ 
ту СХ. 3 : значение счетчика -> СХ 
пех: 


са11 мога рёг [ВХ1[$Г] : вызов одной из процедур 


ааа вВХ.2 : индекс указывает на следующий элемент 
: в таблице смещений процедур 

дес СХ : уменьшить содержимое счетчика на 1 
372  пеж ; следующая итерация 

оу Ах. 4С00Н 

1 21 

ма1п епар 

$и6г1  ргос ; объявление процедуры $и6г1 
1Леа ОХ. $1 

у АН. 91 

11 21 

геф 

$и6г1 епар 

$ибг2 ргос ; объявление процедуры зибг2 
1еа 0%. $2 

оу АН. 9И 

1% 21 

ге* 

иг? епар 

$ибг3З ргос : объявление процедуры зибгЗ 
1еа ОХ. $3 

оу АН, 9И 

1% 21 

гет 

зибгЗ епар 
ета ма1п 
софе — епа$ 


ета 
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Исходный текст программы несложен, хочу лишь обратить внимание на инст- 
рукцию 


ада ВХ.2 

Эта инструкция находится в цикле 

пеж: 

са11 мога рёг [ВХ1[$Т] : вызов одной из процедур 
а99 ВХ. 2 

`зпг. пех 


Поскольку таблица {61 содержит смещения процедур в виде слов, то для пере- 
хода к следующему элементу таблицы содержимое ВХ увеличивается на 2. 

Результатом выполнения подпрограммы будет вывод на экран строк: 

Меаг 1па1гесе са11 зибг1 дето 2! 

№ аг 1п@1гесё са11 зибг2 дето 2 ! 

Меаг 1п41гесф са11 зибг3З дето 2 ! 

Последним мы рассмотрим косвенный дальний вызов. Его основное отли- 
чие от косвенного ближнего вызова состоит в том, что подпрограмма находится 
в другом сегменте, а в ячейке памяти содержится полный адрес подпрограммы, 
включая сегмент и смещение. 

Пример косвенного дальнего вызова приведен в листинге 6.6. Это 16-разрядное 
приложение, в основу которого положен исходный текст предыдущего примера. 


Листинг 6.6. Демонстрация косвенного дальнего вызова (16-разрядная версия) 


„юде1 1агде 
бака зедтепе 
{61 1а6е] дога 
00 $и6г1 ; дальний адрес процедуры $и6г1 
00 зибг2 ; дальний адрес процедуры $и6г2 
00 зибгЗ ; дальний адрес процедуры $ибгЗ 
$1 ОВ бай. бай. "РАВ ТМОТВЕСТ СА $и6г1 БЕМО !$“ 
$2 ОВ 0аи. бай. “РАВ ТМОТВЕСТ САМ. зибг2 БЕМО !$" 
$3 08 0ан, бай, “РАВ ТМОТВЕСТ САЁЕ зибгЗ ВЕМО !$" 
Чака еп4$ 


с04е0 зедтепе 
аззите (5:с04е0, 05:дафа 


ма1п ргос 
поу АХ, дата 
ту 05. АХ 
1еа $1. +61 ; адрес таблицы адресов процедур -> 51 
ризн $1 : сохраним для дальнейшего использования 
: заполняем таблицу адресов для каждой 
: из процедур $м6г1. $и6г? и $ибг3 
ту мога рёг [51]. отРзеё зибг1 ; сиещение процедуры зибг1 -> первое 


; слово двухсловной ячейки памяти 


тоу АХ. с0де1 ; адрес сегмента, где находится 
: процедура зи5г1 -> АХ 

тоу мога рёг [51+2]. АХ : содержимое АХ -> второе слово 
; переход к следующему элементу таблицы 
: И сохранение дальнего адреса процедуры 
: $и6г2 во втором двойном слове 

ада 51. 4 


продолжение „2 
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Листинг 6.6 (продолжение) 


ОУ 
оу 
моу 


а99 
оу 
тоу 
тоу 


рор 


хог 


ОУ 
пеж : 
са11 


а99 


дес 
02 


ОУ 
11% 
ма1п 
со4е1 
аззите 
$ибг1 
]еа 
оу 
1% 
ге 
$и6г1 
с09е1 
соде2 
аззите 
5ибг2 
Теа 
оу 
1% 
ге 
$ибг2 
соде? 
содеЗ 
аззите 
$ибгЗ 
Теа 
оу 
1% 
геф 
$ибгЗ 
с04е3 


мога рег [51]. оЁР5её зибг2 
АХ. соде2 
мога рёг [$1+2], АХ 


$1. 4 

мог рёг [51], отР5её $ибг3 
АХ. со4еЗ 

мога рёг [51+2]. АХ 

$1 


ВХ. ВХ 


С. 3 
@иога рёг [ВХ1[$1 
ВХ. 4 


сх 
пех 


АХ. 4С00И 
211 

епар 
зедтепе 
С5:с049е1 
ргос Гаг 
ОХ. $1 
АН. ЭП 
21й 


епар 
еп4$ 
зедтепе 
(5:соде2 
ргос Таг 
0Х. $2 
АН. ЭН 
21 


епар 
еп4$ 
зедтептт 
С5:со4е3 
ргос Таг 
ОХ. $3 
АН. 9П 
218 


епар 
ета$ 


епб татп 


епд 


: переход к следующему элементу таблицы 
; И сохранение дальнего адреса процедуры 
: 5и6г3 в третьем двойном слове 


; восстанавливаем начальный адрес 

; таблицы 61 

; подготавливаем регистр ВХ, который 
; будет использован для индексации 

; таблицы 

: значение счетчика -> СХ 


; дальний косвенный вызов процедур 

: 946г1. зи6г? и зибгЗ 

; переход к адресу следующей процедуры 
: в таблице 61 

: уменьшить счетчик на 1 

: следующая итерация, если 

; СХ не равен 0 


: объявление процедуры $ибг1 


; объявление процедуры $и6г2 


: объявление процедуры $ибг3 
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Программа довольно сложная, поэтому остановимся на ней подробно. 

Анализ процедуры начнем со структуры таблицы 161. Эта таблица содержит 
дальние адреса трех процедур ($и6г1, зибг2 и 5и6гЗ), находящихся в трех разных 
сегментах кода (соде1, соде2 и соде3). Каждый элемент таблицы представляет со- 
бой двойное слово. Младшее слово двухсловного элемента содержит смещение 
(эффективный адрес) процедуры, старшее — адрес сегмента программного кода, 
в котором данная процедура находится. Таким образом, в таблице {61 зарезерви- 
ровано 12 байт памяти для адресов трех процедур. 

Программа заполняет 4-байтовые ячейки памяти необходимой информацией 
так, как это делается, например, для процедуры $и6г2: 


тоу мога рёг [51]. отРзеф зибг2 
оу АХ. содеё 
оу мог рёг [$1+2]. АХ 


После заполнения таблицы нужной информацией основная программа (нахо- 
дящаяся в программном сегменте соде0) в цикле пехф, состоящем из трех итера- 
ций, выполняет дальние косвенные вызовы каждой из процедур: 

пех: 

са11 Чмога рег [8Х1[$1] 
а94 ВХ. 4 


дес СХ 
312 пеж 


Результатом работы программы является вывод следующих трех строк на экран: 


РАВ ТМОТВЕСТ САЦ. $и6г1 ВЕМО ! 
РАВ ТМОТВЕСТ САС зибг2 БЕМО ! 
РАВ ТМОТВЕСТ САС зибгЗ БЕМО ! 


Прежде чем закончить тему адресации процедур, хочу сделать некоторые за- 
мечания. Если вы работаете с 32-разрядными приложениями (используется ди- 
ректива .тоде] +1а{), то понятия «дальний вызов» не существует. Приложение 
выполняется в едином линейном адресном пространстве размером вплоть до 
4 Гбайт, где данные и код перемешаны, а сегментные регистры установлены в од- 
но и то же значение. Все вызовы и команды переходов считаются ближними 
(атрибут пеаг руг). Для таких вызовов можно применять те же режимы, что и для 
ближних вызовов в 16-разрядных моделях памяти (прямой ближний и косвен- 
ный ближний), но использовать при этом 32-разрядные переменные и регистры. 

Для иллюстрации вышеизложенного приведу фрагмент 32-разрядной програм- 
мы, вычисляющей сумму и разность двух целых чисел с использованием двух 
процедур. Исходный текст программного кода показан в листинге 6.7. 

Программный код включает в себя вызывающую процедуру _Таг_дето32 и вы- 
зываемые процедуры $45] и $452. Процедура 5и61 вычисляет сумму чисел 11 и 12, 
помещая результат в младшее двойное слово переменной гез. Процедура $962 вы- 
числяет разность тех же чисел и помещает результат в старшее двойное слово 
переменной гез. Процедура _Таг_9ето32 вызывает процедуры по адресу, находя- 
щемуся в регистре ЕЗТ. Регистр Е$1 получает его из таблицы 151, содержащей соот- 
ветствующие адреса в двухсловных переменных. 
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Листинг 6.7. Демонстрация косвенного ближнего вызова (32-разрядная версия) 


.686 
„лоде? Р1а+ 
ор&1оп сазетар: попе 
.Чафа 
{61 Табе] дмога 
06 $61 
060 зи62 
11 600 -39 
12 0041 
гез 00 2 0\Р(0) 
.соде 
_Таг_детюЗ2 ргос 
1еа  ЕЗТ, 61 
тоу [Е51]. оРР5её $461 
тоу [Е$1+4]. отРзеё зи62 
са1] @мога руг [Е$1] 
са11 мога рёг [Е51+4] 
1еа  ЕАХ, гез 
ге 
_Таг_@етюЗ2 епар 
$и61 ргос 
с1с 
тоу ЕАХ. 11 
адс ЕАХ. 12 
поу гез. ЕАХ 
ге 
$61 епар 
$и62 ргос 
сс 
тоу ЕАХ. 11 
$66 ЕАХ, 12 
тоу гез+4, ЕАХ 
ге 
$62 епдр 
епа 


Процедура _Гаг_етоЗ2 возвращает в программу адрес переменной гез, содер- 
жащей два двойных слова с результатами сложения и вычитания. Как видно из 
листинга, 32-разрядный код намного упрощает механизм вызова подпрограмм, 
поскольку отпадает необходимость в сегментации программы и данных, а это 
значительно повышает производительность программ в целом. 


6.3. Параметры процедур и возвращаемые 
значения 


Наиболее распространенным способом для передачи аргументов в подпрограммы 
в языке ассемблера является размещение аргументов в регистрах. При этом вызы- 
вающая программа записывает фактические параметры в регистры, а процедура 
извлекает их оттуда и использует в своей работе. Подобный метод очень эффек- 
тивен, поскольку вызванная подпрограмма может непосредственно использовать 
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переданные значения, при этом обращение к регистрам выполняется значительно 
быстрее, чем обращение к памяти. 

Должен заметить, что имеются и определенные ограничения на использова- 
ние этого метода. Дело в том, что процессор имеет не так много регистров, в то 
время как чуть ли не в каждой команде требуется тот или иной регистр. Существу- 
ет высокая вероятность того, что вызывающей программе и процедуре одновре- 
менно потребуются для работы одни и те же регистры, что усложнит ситуацию. 
Можно попытаться разработать приложение таким образом, чтобы вызывающая 
программа и процедура использовали разные регистры, хотя сделать это доволь- 
но сложно — опять-таки по причине их ограниченного количества. 

Простейший вариант избежать подобной ситуации — сохранить регистры в сте- 
ке при входе в подпрограмму и восстановить их при выходе из подпрограммы. 
Какие же регистры процессора можно использовать для передачи параметров 
и возврата результата? Программист может выбирать те или иные регистры, ис- 
ходя из своих соображений, но и здесь есть некоторые правила. 

Чаще всего для передачи параметров применяют регистры ЕАХ, ЕВХ, ЕСХ, ЕСХ, не- 
много реже — ЕВР, ЕЗТ, ЕОТ. Регистр ЕВР обычно используется вместе с регистром ука- 
зателя стека Е$Р для доступа к параметрам, находящимся в стеке, и об этом мы пого- 
ворим отдельно. Регистры Е$1 и ЕО] удобны при выполнении операций с массивами 
данных в качестве индексных, хотя можно применять их по своему усмотрению. 

Проиллюстрируем сказанное примером. Для простоты будем считать наш 
программный код 32-разрядным и использовать регистры и переменные той же 
разрядности. Предположим, что нужно найти меньшее из двух целых чисел и вы- 
числить абсолютную величину (модуль) этого минимума. Для решения этой за- 
дачи разработаем две процедуры на ассемблере: п1п1п — для вычисления мини- 
мума и т1паб$ — для определения его абсолютного значения. 

Процедура т1п1и{ в качестве параметров принимает два целочисленных значе- 
ния, процедура т1паБ$ в качестве единственного параметра — одно целочисленное 
значение. 

Условимся первый параметр процедуры т1и1п{ передавать в регистре ЕАХ, а вто- 
рой — в регистре ЕВХ. Предположим, что у нас имеется два целых числа, располо- 
женные в переменных 11 и 12. Кроме того, создадим переменные п1п_уа] и а6$_\а1 
для сохранения минимума и модуля числа соответственно. Обе процедуры воз- 
вращают результат в регистре ЕАХ. Результат выполиения процедуры п1и1 и явля- 
ется входным параметром для процедуры тпаБ$. 

После всех допущений и предположений исходный текст фрагмента програм- 
мы может выглядеть так, как показано в листинге 6.8. 


Листинг 6.8. Демонстрация передачи параметров процедуре через регистры 
(32-разрядная версия) 
.Чата 

11 00 34 

12 00 17 

ии_ма1 00 ? 

а6$_уа1 00 ? 


продолжение : 
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Листинг 6.8 (продолжение) 


.соде 
‘юм ЕАХ. 11 
оу ЕВХ. 12 


са1] тии 
: минимум двух чисел 11] и 12 находится в регистре ЕАХ. 
: Сохраним это значение в. переменной т1п_уа]1 
: и найдем абсолютное значение 
моу  п1п_маТ, ЕАХ 
са1} — м1паБ$ 
; сохраним модуль числа в переменной аБ$_ма} 
ту — а6$ уа\. ЕАХ 


; здесь объявляются процедуры м1и1пё и м1паБ$ 
иитие ргос 


стр ЕАХ.ЕВХ 
Л ех1& 
оу ЕАХ.ЕВХ 
ех1: 

ге 


пти1ие епар 
п7паб$ ргос 
оу ЕАХ. т1п_ма1 


стр ЕАХ. 0 
39е ди 
пед ЕАХ 
дите: 

ге 


п1паб$ епар 


При создании этого программного кода мы не делали никаких предположений 
относительно сохранности содержимого регистров. Если вызывающая програм- 
ма в момент передачи управления процедуре т1л1п{ использовала регистр ЕВХ, то 
. его содержимое может быть разрушено вызываемой процедурой. Чтобы избежать 
этого, нужно сохранить регистр ЕВХ в стеке: 

моу ЕАХ. 11 

ризй ЕВХ 

тмоу ЕВХ., 12 

са11 ми 

рор ЕВХ 

Сохранение регистров желательно делать в любой процедуре, даже если оче- 
видно, что основная программа не использует те же регистры, что и процедура. 
Программный код в дальнейшем может измениться (что происходит очень ча- 
сто), и может оказаться так, что после этих изменений основной программе потре- 
буются эти регистры. Лучше всего предусмотреть сохранение всех регистров, 
воспользовавшись специальными командами ризпа, ризПаа, рора и рораа. 

Замечу, что сохранять значение регистра, посредством которого процедура 
возвращает результат (обычно это АХ или ЕАХ), не нужно, поскольку в изменении 
этого регистра и заключается цель работы процедуры. 
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Передача параметров через регистры — удобный метод и используется очень 
часто. Он является эффективным, когда число параметров невелико; если же па- 
раметров много, то для них просто не хватит регистров. В таком случае реализу- 
ют другой способ передачи параметров — через стек: основная программа запи- 
сывает фактические параметры (их значения или адреса) в стек, а процедура 
затем их оттуда извлекает. Это наиболее распространенный способ, применяе- 
мый в большинстве программ. 

Как процедура получает доступ к параметрам? Общепринятым для этих целей 
считается регистр ЕВР. В него необходимо поместить адрес вершины стека (на него 
указывает регистр Е5Р), а затем использовать выражения вида [ЕВР+п] для доступа 
к параметрам процедуры. Максимальное значение числа п определяется количест- 
вом параметров и должно быть кратным 2 (2, 4, 6, 8 ит. д.). При этом желательно 
сохранить регистр ЕВР, поскольку он может потребоваться в основной программе. 

Рассмотрим пример процедуры (5462), в которой требуется найти разность двух 
целых чисел, причем параметры этой процедуре передаются через стек. Как обыч- 
но, процедура возвращает результат операции в регистре ЕАХ. Положим, что вы- 
зывающая программа передает процедуре в качестве параметров целочисленные 
переменные 11 и 12, а результатом выполнения процедуры будет разность 11 - 12. 

Первое, что должна сделать вызывающая программа, — поместить передавае- 
мые параметры в стек. Затем процедура должна извлечь их из стека и обработать. 
Вот исходный текст программного кода: 


„ое Е1а* 
„Чата 
11 00 34 
12 00 190 
.соде 
ризй 12 
ризй 11 
са! $и62 
рор 11 
рор 12 
$иБ2 ргос 
ризН ЕВР 
тоу ЕВР., ЕЗР 
тоу ЕАХ. дога рёг [ЕВР+8] 
зи6 ЕАХ. дога рёг [ЕВР+12] 
рор ЕВР 
ге 
5$и62 епар 


Проанализируем исходный текст. В программном сегменте с помощью сле- 
дующих команд параметры 11 и 12 помещаются в стек: 
ризй 12 


ризй 11 
са11 зиб2 


114 Глава 6 * Процедуры на языке ассемблера 


Затем вызывается процедура $402. Содержимое стека после выполнения этих 
команд будет таким, как показано на рис. 6.8. 


Младшие Область стека Старшие 

адреса адреса 

памяти памяти 
—— -—— 





ПГ 


ЕЗР ЕЗР + 4 ЕЗР +8 — Предыдущее 
значение 5Р 


Рис. 6.8. Состояние стека после выполнения команд ризп 12 и ризН 11 


Поскольку программа оперирует двойными словами, то содержимое указателя 
стека после выполнения команд ризИ смещается на 8. Очередная команда са11 $и62 
помещает в стек адрес команды, которая будет выполняться следующей. После 
входа в процедуру 5152 при помощи команды ризй ЕВР в стеке сохраняется содер- 
жимое регистра ЕВР, который должен использоваться для доступа к параметрам 11 
и 12 в стеке. Область стека будет выглядеть так, как показано на рис. 6.9. 


Младшие Область стека Старшие 

адреса адреса 

памяти памяти 
-—— 





ЕЗР ЕЗР + 4 ЕЗР +8 — ЕЗР +12 Предыдущее 
значение 5Р 


Рис. 6.9. Состояние стека после выполнения команд са! $и62 и ризН ЕВР 


Теперь, например, чтобы обратиться к перемениой 11, следует в качестве од- 
ного из операндов указать [ЕВР+8], а переменная 12 будет находиться по адресу 
[ЕВР+12]. Как видим, первая помещенная в стек переменная имеет наибольший 
адрес, а последняя — наименьший. Следующие две инструкции ассемблера вы- 
полняют вычитание 12 из 11, то есть 11 - 12: 


оу ЕАХ. дмога рёг [ЕВР+8] 
зиБ ЕАХ. дога р\г [ЕВР+12] 


Результат вычитания остается в регистре ЕАХ и возвращается вызывающей 
программе. Предпоследняя команда рор ЕВР восстанавливает содержимое регист- 
ра ЕВР, а команда геф передает управление инструкции, следующей за командой 
са11, путем извлечения содержимого стека адреса этой инструкции и помещения 
этого адреса в регистр Е1ТР. 

Таким образом, после завершения процедуры $462 в стеке остаются перемен- 
ные 11 и 12. Вызывающая программа может хранить определенные данные в етеке 
по определенным смещениям относительно вершины стека, но проблема в том, 
что указатель стека не соответствует тому, который нужен программе. Если про- 
исходит обращение к стеку вызывающей программы, то немедленно наступает 
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крах. Поэтому очень важно восстановить или, по-другому, очистить стек до того 
состояния, какое он имел перед вызовом процедуры. Очистить стек может как 
вызывающая программа, так и процедура. 

Простейший вариант — после вызова $и62 выполнить две команды рор в обрат- 
ном порядке, что и сделано в этом фрагменте кода: 

рор 11 

рор 12 

Эти команды никакой полезной функции, кроме восстановления указателя 
стека, не выполняют. Вызывающая программа может очистить стек и более 
изящным способом, сразу же после команды са11 используя команду 


а49 ЕР. 8 


В результате выполнения этой команды указатель стека Е5Р сместится на два 
двойных слова, что нам и нужно. Тогда последовательность команд вызова про- 
цедуры и восстановления стека будет иметь вид 

ризй 12 

ризй 11 

са11 зибё 

а94 ЕЗР, 8 


Процедура $\52 может и сама восстановить стек при выходе. Это можно сделать 
с помощью специальной команды геф п, где п — количество байтов, подлежащих 
удалению из стека. Программный код процедуры $и62 в этом случае изменится: 

$и652 ргос 

ризй ЕВР 

оу ЕВР. ЕЗР 

моу ЕАХ. дмога рёг [ЕВР+8] 

зиБ ЕАХ. Фиюга рег [ЕВР+12] 

рор ЕВР 

ге 8 

$462 епар 


Команда ге! — это одна из модификаций команды гей п при п = 0. При задании 
параметра я нужно помнить, что в операнде не должен учитываться адрес возвра- 
та — команда ге? считывает его до очистки стека. 

С точки зрения эффективности программы лучше, если очистку стека будет 
делать сама процедура. Если обращений к процедуре много, то в основной про- 
грамме команду ад4 придется использовать многократно, в то время как вызывае- 
мая процедура одна и в ней можно вызвать команду гей и. Это полезное правило 
для оптимизации программ: если какое-то действие может быть выполнено либо 
в основной программе, либо в процедуре, то лучше, если это будет сделано в про- 
цедуре. В этом случае требуется меньше команд. 

Такова общая схема передачи параметров через стек. Еще раз напомню, что 
этот способ передачи параметров универсален, его можно использовать при 
любом числе параметров. Однако этот способ сложнее, чем передача парамет- 
ров через регистры, поэтому желательно передавать параметры через регистры, 
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так проще и короче. Что же касается результата процедуры, то он крайне редко 
передается через стек и обычно передается через регистр. Общепринято, что ре- 
зультат выполнения процедуры возвращается в регистре ЕАХ. 


6.4. Использование общих переменных 
в процедурах 


В болынинстве случаев, особенно при разработке больших программ, возникает 
ситуация, когда требуется обрабатывать одни и те же объемы данных несколь- 
кими процедурами или даже отдельными программами. Очень удобно было бы 
сделать эти данные доступными для нескольких процедур. Может возникнуть 
вопрос: зачем применять для взаимодействия процедур какие-то специфические 
приемы, когда данные можно передавать от одной процедуры другой через па- 
раметры. Только что рассмотренные примеры как раз и демонстрировали такую 
методику. Однако в случае использования параметров как средства взаимодейст- 
вия между процедурами возникают определенные проблемы. Перечислим только 
некоторые из них: 


® При относительно большом количестве процедур обработки одних и тех 
же данных производительность процедуры снижается. Предположим, в про- 
цедуре имеется массив чисел, который обрабатывается несколькими про- 
цедурами. Каждый раз при обращении к процедуре другие программы 
вынуждены вычислять каким-то образом адреса элементов массива. Если 
используется стек, а в подавляющем большинстве случаев так оно и есть, 
возникает необходимость обращения к стеку для получения местополо- 
жения элементов массива в памяти. При относительно редком обращении 
к процедуре таких проблем может и не возникнуть, но с усложнением 
структуры программы и алгоритмов обработки быстродействие приложе- 
ния может снизиться. 


® При обработке одних и тех же данных разными процедурами структури- 
руемость программы, использующей ассемблерные процедуры, ухудшается. 


Общие или, как их еще называют, глобальные, переменные позволяют рабо- 
тать с данными при минимальном использовании стека, что экономит процессор- 
ное время. Кроме того, фиксированные привязки общих переменных на этапе 
компоновки ускоряют доступ к ним. 

В дальнейшем мы будет употреблять термины «общая переменная» и «гло- 
бальная переменная» как синонимы. Для работы с общими переменными в языке 
ассемблера используются директивы риБ11с и ехрегп. Директива риуБ11с объявляет 
переменную или процедуру доступной для других модулей, директива ехфегп 
указывает на то, что переменная или процедура является внешней по отношению 
к выполняемой процедуре. Обе директивы применяются для компоновки основ- 
ной программы или процедуры из нескольких объектных модулей и очень удоб- 
ны для построения больших программ. 
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Глобальные переменные объявляются следующим образом: 


» в объектном модуле, где находится такая переменная, необходимо указать 
на возможность доступа к ней с помощью директивы риБ11с; 


» вобъектных модулях, из которых происходит обращение к общей перемен- 
ной, необходимо объявить ее с директивой ежеги. 


Использование общих переменных лучше показать на примере. Пусть гребу- 
ется вычислить выражение а, + а, - 5., где а, а» и 6; — целые числа. Вычисле- 
ние выполним с помощью двух процедур: _а982, которая вычисляет сумму а, + а, 
и _°1, которая вычитает из этой суммы число р. 

Результат вычислений возвращается в вызывающую процедуру (назовем ее 
_ада_зи6). Все три подпрограммы реализованы в виде отдельных файлов АЗМ, 
которые после компиляции образуют три файла объектных модулей с расшире- 
нием ОВ3. С помощыьо компоновщика (Ник или другого) эти файлы можно вклю- 
чить в 32-разрядное приложение. 

В подпрограмме _а94_ зи определим переменные а1, а2 и 3 как двойные 
числа, которым присвоим конкретные значения. Поскольку все переменные 
должны быть доступны из других подпрограмм, находящихся в других объект- 
ных файлах, необходимо их объявить с днрективой руб11с. Кроме того, внешние 
подпрограммы _а992 и _5и62, используемые процедурой _а44 зи6, должны быть 
объявлены с директивой ежеги. Исходный текст подпрограммы _а49_$и6 показан 
в листинге 6.9. 


Листинг 6.9. Демонстрация использования общих переменных (32-разрядная версия) 


.686 

„дет Раф 

„5баск 1000 

орЕТоп сазетар: попе 
ехфегп _а@42:ргос 
ехфегп _ и61 :ргос 
риуБ11с а1, а2. ЬЗ 


„Чата 
а1 00 12 
аг 00 17 
3 0034 
.соде 
_а94_ зи6 ргос 
С1с : очищаем флаг переноса 
са11 _а9а2 : вычисляем сумму а1 + а2 
ризй ЕАХ : промежуточный результат помещаем в стек. 


: поскольку он будет использоваться 
; процедурой _5и61 
са11 _$и61 : вычисляем разность полученной суммы (а1 + а2) 
: и числа 63. Результат возвращается в основную 
; программу через регистр ЕАХ 
ге 
_а09_зи6 епар 
епа 


118 Глава 6 » Процедуры на языке ассемблера 


Обратите внимание на директивы, выделенные жирным шрифтом. Если не 
указать процедуры как внешние (ехфегп), то компилятор, не обнаружив их в те- 
кущем модуле, выдаст ошибку. Если не указать переменные с атрибутом риб11с, 
то при компиляции этого АЗМ-файла никаких ошибок не будет, зато они появят- 
ся в процессе компиляции других модулей, где эти переменные используются. 

Далее представлен исходный текст процедуры _а042: 

.686 

моде] Е]а& 

орЕ1оп сазетар: попе 

риБ11с _а9а2 
ехфегп а1: ОМЮКО 
ехфегп а2: ОМЮКО 

.соде 

_а9а2 ргос 
оу ЕАХ. а1 
а4с ЕАХ, аё 
ге 

_а992 епар 

епа 


Поскольку процедура _а942 используется в подпрограмме _а44_5и6, то она долж- 
на быть объявлена как общая (риб11с) для внешних по отношению к данному 
объектному файлу программ. Кроме того, процедура _а442 задействует две пере- 
менные, определенные в другом объектном файле (где определена процедура 

_а99_зи6)), поэтому они должны быть указаны как внешние (ежеги). Все эти ди- 
рективы выделены жирным шрифтом. 

Исходный текст самой процедуры понятен, поэтому останавливаться на нем 
мы не будем. Замечу лишь, что результат сложения возвращается, как обычно, 
в регистре ЕАХ. 

Проанализируем последнюю из трех подпрограмм — _$и62. Исходный текст 
процедуры: 

.686 

.лоде] ТТа% 

ор%1оп сазетар: попе 


ехфегп 63: ОКО 
риБ11с _$и51 


.соде 
_$461 ргос 
ризй ЕВР 
моу  ЕВР. ЕЗР 
поу  ЕАХ, Омога рег [ЕВР+8] 
зи6  ЕАХ. Ь3 
рор ЕВР 
ге 4 
_$и61 епар 
епд 


Процедура использует переменную 63 из модуля, в котором находится под- 
программа _а44_зи6, поэтому она объявлена как внешняя. Сама процедура _зи62 
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объявлена доступной для программ из других модулей, поскольку вызывается из 
внешней подпрограммы _а44_ $. Эти директивы выделены жирным шрифтом. 

Остановимся на программном коде процедуры _зи62 более подробно. Вспом- 
ним, что эта процедура вызывается из _а49_зи6 следующим образом: 


ризп ЕАХ 
са11 _ $461 


Процедуре передается один параметр через стек (сумма а1 и а2). Для извлече- 
ния параметра из стека в процедуре _5и62 используется регистр ЕВР (мы рас- 
сматривали эту методику ранее). Перед возвратом в вызывающую подпрограмму 
в стеке находится один параметр, помещенный туда при вызове, поэтому команда 
ге должна очистить стек. Требуется удалить 4 байта, что и делает команда ге 4. 

Как и в предыдущих случаях, процедура возвращает результат в регистре ЕАХ. 
Таким образом, вызывающая подпрограмма _а44 _5и6 перед инструкцией возврата 
будет содержать результат в регистре ЕАХ. При указанных значениях переменных 
регистр ЕАХ будет содержать значение —5. Несмотря на простоту приведенного 
примера, он демонстрирует основные аспекты использования общих переменных 
в программах на ассемблере. 


Операции со строками 
и массивами 





Большинство команд ассемблера оперируют байтом, словом или двойным словом. 
Однако во многих случаях бывает необходимо переслать или сравнить поля дан- 
ных, которые превышают по размеру слово или байт. Например, может потребо- 
ваться сравнивать описания или имена, чтобы отсортировать их в определенной 
последовательности. Элементы такого формата известны как строковые данные 
и могут иметь как символьный, так и числовой тип. 

Преимущества ассемблера проявляются и при обработке строк и массивов дан- 
ных. Под операциями обработки строк мы будем понимать следующие операции: 


» сравнение двух строк; 

»® копирование строки-источника в строку-приемник; 
® считывание строк из устройства или файла; 

»® запись строки в устройство или файл; 

»® определение размера строки; 

® нахождение подстроки в заданной строке; 

® объединение двух строк (конкатенация). 


Операции над строками широко используются в языках высокого уровня. 
Ассемблерная реализация таких операций позволяет существенно повысить бы- 
стродействие программ, особенно если требуется обработать большое количество 
строк и массивов. 

Строка символов или чисел, с которыми программа работает как с группой, 
является обычным типом данных. Программа пересылает строку из одного места 
в другое, сравнивает ее с другими строками, ищет в ней заданное значение. При 
работе со строками программист сталкивается с необходимостью определить 
окончание строки, чтобы точно знать, когда заканчивать обработку. Существует 
два принципиально разных подхода к идентификации строки и ее элементов. 
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Можно указать размер строки (количество элементов, входящих в строку), за- 
писав число элементов в первый байт строки. По общепринятым соглашениям 
первый элемент строки имеет смещение 0, поэтому можно сказать, что размер 
строки прописывается в нулевом элементе, а символы строки начинаются с пер- 
вого элемента. Такой принцип был реализован в языке Разса| и в среде програм- 
мирования Оеры. Такие строки называются короткими (5Воге $41115$), посколь- 
ку их размер не превышает 255 байт. 

Наибольшее распространение получил второй способ идентификации строки, 
при котором в конце строки указывается нулевой символ (0). Такие строки назы- 
ваются строками с завершающим нулем (пи-(егпипа(е4 $и119$). Они использу- 
ются в языке С и в операционных системах УЛп4до\5. Вот как выглядит такая 
строка на языке ассемблера: 


$4г119_0 ОВ "МИЕ-ТЕКМТМАТЕО УТВТМ 6" .0 


В языке ассемблера не существует каких-то стандартов для идентификации 
строк. Размер строки можно указать, используя нехитрый трюк. Лучше всего по- 
казать это на примере: 

Чака 

$1 ОВ "5ТА1Мб" 
Те" ЕЦИ $-51 


Здесь определена строка символов $1, а ее размер 1еп равен разности началь- 
ного и конечного адресов элементов. Такой вариант очень удобен, поскольку кон- 
станту 1еп можно использовать для циклической обработки элементов строки. 
При этом 1еп помещается в счетчик символов (обычно регистр СХ или ЕСХ, хотя 
могут быть и другие регистры). 

Ничто не мешает использовать и строки с завершающим нулем, при этом в про- 
цессе обработки придется отслеживать конец строки. Вот фрагмент программно- 
го кода, демонстрирующий эту возможность: 


"дата 


$1 ОВ "ТЕЗТ УТЕ1№".0 
„сое 
1еа "еб. $1 ; адрес первого элемента строки 


стр Буфе рег [ЕЗГ].0 : проверка на конец строки 


Если использовать формат коротких строк (стиль Разса]), то обработку эле- 
ментов можно организовать так, как показано в следующем примере: 


‚даа 
$1 08 7. "5ТАТК1" 
.соде 
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Теа ЕЗТ. $1 

тоу СЕ. Бубе рёг [Е$Т] 

11с Е$1 

В этом случае обработка строки начинается с элемента с индексом 1, то есть 
находящегося по адресу [Е51+1]. В регистр СЁ помещается размер строки $1, рав- 
ный 7 (команда тоу (1. Буфе рёг [Е$!]). Определенным недостатком такого метода 
является необходимость заранее знать размер строки. 

До сих пор мы рассматривали строки, состоящие из символов, но наши рассу- 
ждения применимы и к последовательности произвольных байтов, слов и двой- 
ных слов. В этом случае такую совокупность элементов называют массивом. Для 
байтовых массивов действительны те же приемы работы, что и для символьных 
строк, а вот при работе с элементами размером в слово или двойное слово следует 
учитывать некоторые особенности, связанные с размерностью элементов. 

Рассмотрим следующий пример. Пусть имеется массив целых чисел, пред- 
ставленных двойными словами. В этом случае для правильной обработки эле- 
ментов в цикле счетчик в регистре СХ (ЕСХ) должен содержать количество двой- 
ных слов, а не байтов: 


` дака 


пит_аггау 00 34. 456. -768. 12. 

Теп ЕСИ $-пит_аггау 

.соде 

Теа ЕЗГ. @мога рёг пит аггау ; адрес первого элемента -> Е$ЗТ 
пу ЕСХ. 1еп : размер массива в байтах -> ЕСХ 
Зиг ЕСХ. 2 : преобразовать в размерность 

: ДВОЙНЫХ СЛОВ 

ад9 ЕЗ1. 4 : переход к следующему элементу массива 


Помимо коррекции счетчика необходимо правильно указывать адрес следую- 
щего элемента массива. Для двойного слова следующий элемент отстоит от пре- 
дыдущего на 4 байта, для слова — на 2 байта. 

Для работы со строками и массивами в систему команд процессоров 1пбе] 
включены специальные команды обработки строк. Эту группу команд в термино- 
логии п называют командами строковых примитивов, или цепочечными ко- 
мандами. Рассмотрим принципы работы цепочечных команд. 

Цепочечная команда может быть использована для многократной обработки 
одного байта, одного слова или двойного слова. Для этого указывается префикс 
повторения гер. Далее приведены модификации префикса гер для команд строко- 
вых примитивов: 


® гер — повторять операцию, пока СХ не станет равным 0; 


® герг, гере — повторять операцию, пока элементы равны, то есть до первого 
неравенства (флаг 22 установлен в 0). Операция прекращается, если флаг 7Е 
устанавливается в {1 или счетчик в регистре ЕСХ (СХ) достигает нуля; 


Операции со строками и массивами 123 


® герпе, герп? — повторять операцию, пока элементы не равны, то есть до пер- 
вого равенства (флаг 7Е установлен в 1). Операция прекращается при уста- 
новке флага 2Р в 0 или при достижении значения 0 в регистре ЕСХ (СХ). 


Для процессоров Гпсе], обрабатывающих слово за одну операцию, использо- 
вание цепочечных команд там, где это возможно, повышает эффективность про- 
граммы. 

В строковых командах не применяются способы адресации, характерные для 
остальных команд обработки строк. Строковые команды адресуют операнды ком- 
бинациями регистров Е51(5Т) или ЕТ (01). 

Операнды источника используют регистр ЕЗ! (51), а операнды приемника (ре- 
зультата) — регистр ЕОТ (01). Все строковые команды корректируют адрес после 
выполнения операции. Строка может состоять из нескольких элементов, но коман- 
ды обработки строк могут обрабатывать только один элемент в каждый момент 
времени. Автоматический инкремент (увеличение) или декремент (уменьшение) 
адреса операнда позволяет быстро обрабатывать строковые данные. Флаг направ- 
ления ОЕ в регистре состояния определяет направление обработки строк. 

Если он равен 1, то адрес уменьшается, а если он сброшен в 0, то адрес увели- 
чивается. Сама величина инкремента или декремента адреса определяется разме- 
ром операнда. Например, для символьных строк, в которых размер операндов равен 
1 байт, команды обработки строк изменяют адрес на 1 после каждой операции. Если 
обрабатывается массив целых чисел, в котором каждый операнд занимает 4 байта, 
то строковые команды изменяпот адрес на 4. После выполнения операции указатель 
адреса в регистрах ЕЗТ ($1) или ЕОГ (01) ссылается на следующий элемент строки. 

Мы будет рассматривать в основном строки с завершающим нулем. Можно 
выделить пять основных команд для работы со строками. К ним относятся: 


® 1ПО\5 — команда перемещения строки данных из одного участка памяти 
в другой; 

® 1045 — команда загрузки в регистр-аккумулятор ЕАХ (АХ, АЕ) строки, адрес 
которой указан в регистре ЕЗТ ($51); 


® $105 — команда сохранения содержимого регистра ЕАХ (АХ, АГ) в памяти по 
адресу, указанному в регистре ЕО! (0Г); 


» стр — команда сравнения строк, расположенных по адресам, содержащим- 
ся в регистрах Е$1 (5Г) и ЕВГ (01); 


® 5$Са5 — команда сканирования строк, которая сравнивает содержимое реги- 
стра ЕАХ (АХ, А|) с содержимым памяти, определяемым регистром ЕТ (01). 


Каждая команда обработки строк имеет три допустимых формата. Например, 
команда тоу\з может иметь одно из представлений: тоузБ, поузи или поу$4. Команда 
моу$Ь служит только для работы с однобайтовыми операндами, поуи — для рабо- 
ты со словами, а тоуз4 — для работы с двойными словами. Суффиксы Б, м и допре- 
деляют шаг инкремента и декремента для индексных регистров Е51 (5Г) и ЕБТ (01). 
Если команда используется в общем формате, то размерность операндов должна 
быть определена явно. 

Перед выполнением команд строковых примитивов необходимо загрузить 
в регистры ЕЗ1 ($Г) и/или ЕОТ (01) адреса обрабатываемых ячеек памяти. 
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Обработку строк и массивов не обязательно выполнять с помощью команд 
строковых примитивов, но использовать такие команды во многих случаях удоб- 
нее. Рассмотрим более подробно операции со строками и начнем с пересылки 
и копирования данных. 

Для иллюстрации операций обработки строк и массивов приводятся исход- 
ные тексты 16-разрядных и 32-разрядных процедур. Для лучшего понимания ма- 
териала большинство 32-разрядных процедур не получают никаких параметров, 
а оперируют данными, определенными внутри самой процедуры. Результат рабо- 
ты процедур возвращается в регистре ЕАХ либо в виде указателя (адреса) резуль- 
тата, либо как непосредственное значенне. 


7.1. Пересылка и копирование данных 


Для выполнения операций пересылки и копирования строк и массивов очень 
удобно использовать команду поуз. Эта команда может применяться для пересыл- 
ки одиночных байтов, слов или двойных слов, однако с префиксом гер и счетчи- 
ком байтов в регистре ЕСХ (СХ) можно выполнять пересылку любого числа символов 
более эффективно. При этом в регистре ЕбТ (01) должен содержаться относитель- 
ный адрес области памяти, в которую будет помещена строка, а адресация источ- 
ника выполняется через регистр ЕЗТ (51). 

Таким образом, перед выполнением команды то\$ следует инициализировать 
регистры ЕЗТ ($1) и ЕШГ (01) требуемыми относительными адресами источника 
и приемника. В зависимости от состояния флага 0Е команда поу$ производит уве- 
личение или уменьшение на 1 (для байта), на 2 (для слова) и на 4 (для двойного 
слова) содержимого регистров ЕОТ (ОГ) и ЕЗ! ($1). 

При разработке 16-разрядных приложений для адресации строки-источни- 
ка используется пара регистров 05:51, для адресации строки-приемника — Е5:0Т, 
а в качестве счетчика — регистр СХ. В 32-разрядных приложениях для адресации 
используются регистры ЕЗГ и ЕТ, а в качестве счетчика — регистр ЕСХ. Команды 
строковых примитивов можно заменить другими командами, причем иногда 
такая замена позволяет повысить производительность программного кода — этот 
и другие подобные вопросы мы рассмотрим в конце главы. 

При использовании команды тоузЬ, поузи или поу$9 компилятор ассемблера 
предполагает наличие корректного размера строковых данных и не требует коди- 
рования операндов в команде. Для команды то\уз размер должен быть закодиро- 
ван в операндах. Например, если переменные 5ТВГ_А и 5ТК1№б_В определены как 
байтовые с помощью директивы 08, то следующая команда будет выполнять пе- 
ресылку байтов, количество которых определено в регистре СХ, из переменной 
ТВ _В в переменную $ТВШ@_А: 


гер поуз $ТЕ1М А. ЗТВТА В 
Эту команду можно записать в альтернативной форме: 
гер тоуз Е$:ВУТЕ РТВГОТ]. 05$:[$1] 


В любом случае перед началом операции следует поместить в регистры 01 и $1 
адреса 5ТВ1№ Аи $ТВ1б В. 
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Префикс гер обеспечивает повторение команды несколько раз, и его нужно 
указывать непосредственно перед командой. Для использования префикса гер не- 
обходимо установить начальное значение в регистре С», в этом случае при выпол- 
нении строковой команды (не только то\у5) происходит декремент регистра СХ до 
нуля. Флаг направления 0Е определяет направление повторяющейся операции: 


для увеличивающихся адресов необходимо с помощью команды С14 уста- 
новить флаг ОЕ в 0; 


для уменьшающихся адресов необходимо с помощью команды 54 устано- 
вить флаг 0Е в 1. 


Можно обойтись и без команд строковых примитивов при копировании дан- 


НЫХ, 


а использовать обычные команды ассемблера. Вот программный эквивалент 


команды гер тоузЬ (для 16-разрядных операндов): 


тои СХ. соитег 
пех: 


тои Ас. [51] 

моу 01]. АЁ 

тс 51 | 4ес $Г ; инкремент или декремент источника 
11с 01 | дес 01 ; инкремент или декремент приемника 
1оор пех 


Рассмотрим практический пример 16-разрядного приложения М$-ОО$, вы- 
полняющего копирование строки с использованием команды тоу5Ъ. Исходный 
текст программы приведен в листинге 7.1. 


Листинг 7.1. Копирование символьных строк при помощи команды тоузЬ 
(16-разрядная версия) 
„тоде? $та11 


„Чата 
$гС 
Теп 
95% 


.соде 


ОВ “СОРТЕО ТЕЗТ $ТВЮб" 
ЕО $-$гс 

ОВ Теп [ЦР ('') 

ОВ '$’ 


$фаг+: 
тоу АХ. @даба : инициализация сегментных регистров 
тоу 05, АХ 
тоу Е5. АХ 
с14 : установим флаг направления ОЕ для инкремента 
1еа 51. $гс : адрес источника -> 05:51 
1еа 01, 954 ; адрес приемника -> Е$:01 
мои СХ. 1еп : Количество копируемых символов -> СХ 
гер тоузЬ ; копирование символов 
1еа ОХ. 95% ; отобразить скопированную строку на экране 


11 21 

пюу АХ. 4с000 
11 21 

еп зфаг+ 
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Перед началом операции копирования необходимо установить флаг направле- 
ния ОЕ так, чтобы адреса источника и приемника увеличивались после каждой 
итерации. Для этого нужно установить флаг в 0 командой с14. Адрес строки- 
источника помещается в регистр $1, а адрес строки-приемника — в регистр 01. 
После копирования содержимое строки отображается на экране с помощью функ- 
ции ЭВ прерывания 211. 

В 32-разрядных приложениях можно воспользоваться копирующей строки 
процедурой (назовем ее _ср_5г1пд$), показанной в листинге 7.2. 


Листинг 7.2. Копирование символьных строк при помощи команды тоу$Ь 
(32-разрядная версия) 


.586 
„моей Рае 
ореТоп сазетар: попе 
‚Чата 
$1 ОВ "ТЕЗТ 5ТВМ@ ТО СОРУ" 
Теп ЕЦЦ $-$1 
$2 ОВ Теп ОУР(" ') 
.соде 
_@р_$%г1пд$ ргос 
с14 
]Леа ЕЗГ. $1 
Теа ЕОТ. $2 
тоу ЕСХ. 1еп 
гер моузЬ 
Теа ЕАХ. $2 
ге 
_ср_$&г1п9$ епар 
епа 


Операцию копирования строк здесь выполняет команда гер то\зВ, но для адре- 
сации строк используются 32-разрядные регистры ЕЗТ и ЕОТ, поскольку в линей- 
ной модели адресации (директива .тоде! {1а{) сегментные регистры не применя- 
ются. Процедура возвращает адрес строки-приемника в регистре ЕАХ. 

Операции копирования можно выполнять также и для массивов целых или 
вещественных чисел. Следующий фрагмент программного кода позволяет копи- 
ровать содержимое целочисленного массива $гс_аггау в массив 45% _аггау при по- 
мощи команды то\$4: 


‚дата 


$гс_аггау 00 23]. -12. 45. -65 
Теп ЕСЦ $-5гс_аггау 

45% аггау 004 [\Р (0) 

.соде 
с19 


тоу ЕСХ, ОМОКО РТВ Тепаггау 
1еа ЕЗГ. ОМОВО РТВ заггау 
1еа ЕОТГ. ОМОВО РТВ даггау 
гер тоу$а 
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Команда тоу$ может использоваться для еще одной весьма полезной операции 
над двумя строками, называемой сцеплением или конкатенацией. При ее выпол- 
нении к строке-приемнику добавляются символы строки-источника. При этом 
программист должен сам позаботиться о достаточном размере буфера приемника. 
Нужно учесть, что буфер приемника должен иметь размер, как минимум, равный 
сумме размеров сцепляемых строк. В листинге 7.3 приводится исходный текст 
16-разрядной программы конкатенации строк. 


Листинг 7,3. Сцепление символьных строк с использованием команды тоу$Ь 
(16-разрядная версия) 


„пофе1 зта11 
„Чата 
$ГС ОВ "АООЕО СНАВАСНТЕВ$$” —; строка $гс, которая будет 
; добавлена к 95% 
Теп_$ис ЕО $-5гс : раэмер строки $гс 
654 ОВ "ОВТСТМАЕ СНАВАСНТЕК$” ; строка-приемник, в конец которой 
; будут добавлены 
; символы строки $гс 
1еп_4$% ЕСИ $-95% ; размер строки 45% 
зирр1 ОВ Теп_$гс+1 БУР(’*) : зарезервированная область памяти 
; для размещения символов из строки 
: $гс и символа пробела для 
: разделения строк 
.соде 
$фагт: 
“оу  -АХ. @дафа 
“оу 05, АХ 
“оу 15. АХ 
с1а 


12а 5, $гс 
а ОГ. аз еп _95%+1 
тоу СХ. еп гс 


пер  `Шо\$Ь 
12а ПХ. 954 
оу АН, 91 
11% 22]1 

оу АХ, 46001 
и 7 

ета $фаге 
епд 


В этой программе к содержимому строки 495+ добавляется содержимое строки 
5гс. Результирующая строка размещается по адресу 45% и выводится на экран. 
Обратите внимание на количество зарезервированных байтов памяти для стро- 
ки-приемника. Результат работы программы выводится на дисплей в виде строки 


ОРТЕТМАЕ СНАКАСНТЕК$ АООЕС СНАВАСНТЕВ$ 


В листинге 7.4 представлен исходный текст 32-разрядной процедуры конкате- 
нации строк (она называется _сопса{_$г1п9$). 

Как и в предыдущих примерах, процедура возвращает адрес результирующей 
строки в регистре ЕАХ. 
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Листинг 7.4. Сцепление символьных строк с использованием команды тоу$Ь 
(32-разрядная версия) 


.586 
„тоде] ТТа+ 
орё1оп сазетар: попе 
„дата 
$гС ОВ "АБОЕР СНАРАСНЕЕК$” 
Теп $гр ЕЦ $-576 
95% ОВ "ОВТОТМА- СНАВАСНЕ:К$” 
Теп 9$, ЕСИ $-95% 
$ирр1 ОВ Теп_згс-рУуР(° *) 
. Сов 
_сопса*_51г1пд$ ргос 
с1а 
Теа ЕЗГ. $гс 


Тюа Е0Г. а5&+1еп, 45% 
тоу ЕСХ. 1еп-$гс 
пер тоу$В 
1юа ГАХ. 45% 
во 
_сопса\,_$%^19$ =епар 
ета 
Конкатенация массивов целых чисел или чисел с плавающей точкой выполня- 
ется по схожей схеме, необходимо лишь учитывать размер операндов. Прини- 
мающий массив должен иметь необходимое пространство для добавления новых 
элементов из массива-источника. Необходимое смещение в массиве-приемнике 
должно пересчитываться с учетом размерности в байтах элемента массива. Ис- 
ходный текст процедуры (она называется _сопса*_94), выполняющей конкатена- 
цию двух массивов целых чисел, представлен в листинге 7.5. 


Листинг 7.5. Объединение двух целочисленных массивов с использованием 
команды тоу$4 (32-разрядная версия) 


.586 
„тоде] ТаЁ 
тореТоп ‘саявтар: попе 

„Чата 
1 00 23. 44..8 
сору агеа 0041 (0) 
12 00 -56.77. -3. 89 
фей ЕСИ $-12 

.соде 


_ сопса_@ ргос 
“оу  ЕСХ. Теп 


сэ"  ЕСХ. 2 

]Теа  ЕОГ. сору_агеа 
1еа  ЕЗГ. 12 

5519 

“гер `поу$Я 

Леа  ЕАХ, 11 

ге 


_сопеа®_@1 епар 
еп 
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В этом фрагменте кода элементы массива-источника 12 записываются в мас- 
сив-приемник 11 начиная с четвертого элемента. В регистр Е5Т помещен адрес 
массива 12, а регистр ЕОТ содержит адрес дополнительной области памяти сору_агеа, 
куда будет производиться копирование. 

Вместо команды Теа ЕОГ. сору_агеа можно использовать команду Теа ЕТ. 11 + 12. 
Здесь число 12 означает смещение в байтах от начала массива 11. После выполне- 
ния процедуры массив 11 будет содержать элементы 23, 44, 8, —56, 7, -3 и 89. 

Анализ операций копирования был бы неполным, если бы мы не упомянули 
о возможностях процессоров Ге! Репбит по обработке массивов данных большой 
размерности. Максимальный размер операнда, над которым можно выполнять 
элементарную операцию, равен двойному слову. Для обработки операндов боль- 
шей размерности, например два двойных слова (учетверенное слово), необходимо 
применять специальные приемы, обрабатывая их как отдельные двойные слова. 

Процессоры Пие! Репйит обеспечивают возможность параллельной обработки 
целочисленных данных, имеющих разрядность до 64 бит, используя так называе- 
мую ММХ-технологию. Мы будем подробно рассматривать принципы, положен- 
ные в основу ММХ, в последующих главах, однако сейчас нас будет интересовать 
одна из команд ММХ-расширения, очень полезная при копировании и пересыл- 
ке данных в обычных операциях, а именно команда по\уд. С помощью этой коман- 
ды можно копировать и перемещать 8-байтовые данные. В качестве одного из 
операндов (источника или приемника) команда обязательно должна использо- 
вать один из 8 специальных 64-разрядных регистров, которые в ассемблере МАЗМ 
обозначаются как ММО — ММ7. Вторым операндом команды может служить 64-раз- 
рядная ячейка памяти. 

Премущества использования команды тоуд обусловлены следующим: 


® заодин цикл можно копировать или перемещать вдвое больше данных, чем 
это позволяют обычные команды, такие, как тоу или то\з94; 


» ММХ-расширение представляет собой отдельный аппаратно-программный 
модуль процессора, функционирующий относительно независимо от осталь- 
ных вычислительных модулей; это позволяет ММХ-командам выполнять- 
ся параллельно с обычными командами, что ускоряет обработку данных; 


» при передаче данных полностью используются преимущества 64-разряд- 
ной шины процессоров пе] РепНит. 


Хочу сделать очень важное замечание: для успешной компиляции модулей, 
включающих ММХ-команды, необходимо, чтобы компилятор ассемблера поддер- 
живал эти команды. Старые компиляторы МАЗМ версий 6.13.хххх и 6.14 хххх 
работать не будут, поэтому нужно использовать компилятор версии 7.10.хххх, 
входящий в состав М!сгозой Опуег Оеу@ортепё КЁ для \Лш4о\з ХР или Ут- 
4о\$ Зегуег 2003. 

Сейчас мы посмотрим, как практически реализовать эффективное копирова- 
ние данных с помощью ММХ-команд. Наш пример представляет собой процеду- 
ру (назовем ее _сору_по\а), выполняющую копирование элементов массива целых 
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чисел из одной области памяти в другую блоками по два элемента за одну итера- 


цию. В качестве параметров процедура принимает: 


® адрес массива-источника [ЕВР+В]; 


® адрес массива-приемника [ЕВР+12]; 


® размер массива в двойных словах ([ЕВР+16]. 


Процедура не возвращает результат, модифицируя массив-приемник (напом- 
ню, что каждый элемент массива имеет размерность двойного слова). Кроме того, 
массив-приемник имеет размер, как минимум, равный размеру массива-источни- 


ка. Исходный текст процедуры представлен в листинге 7.6. 


Листинг 7.6. Копирование целочисленного массива при помощи ММХ-команды тоу4 


({32-разрядная версия) 


.686 


„ое 1]а+ 


ор&1оп сазетар: попе 


„ММХ 
.соде 


_сору_тоуд ргос 


ризи -ЕВР 





хог ТЕ0Х, 


оу ВХ. 


91\ ТЕВХ 


тоу тЕСХ, 


-пехё: 


поуа ММО. 


. БР 

‚ @юга ри“ ©[ЕВР+8] 
моу ТЕ0Т. 
тоу :ЕАХ. 


юга р“ [ЕВР+12] 
@юга ре“ [ЕВР+16] 


ЕОХ 


[Е$1] 


тоуа ТЕОТ]. М0 


ай СЕТ. 


ав ЕО, 


@эс СЕСХ 


772 теж 
стр -Е0Х. 


3 эк 
тоу СЕСХ. 


В 


8 


0 


ЕОХ 


; апрес насеива-источника -> ЕТ 

: адрес нассива-призмника -> Е] 

: размер массива-источника в двейных 
: словах-->тЕАХ 

: регистр ЕОХ участвует в операции 

; деления. поэтому -обнуляен-эго 


: вычислим. сколько учетверенных слов 
: помещается в массиве-источнике 

: посяе деления: ЕАХ = частное. 

; ЕОХ = остаток. Количество 

; учетверенвых слов -> ЕСХ (счетчик 

: цикла) 


: копировать 8-байтовйй операнд 

: из васеива-источника в:регистр ММО 

: копировать 8-байтовый операнд-из 

: регистра ММО в массия-приемник 

: апрес следующего :8-байтового эленента 
: массива-источника -> ЕТ 

; апрас следующего -в-байтового эленента 
: массива-приемника -> ЕТ 

: уменьшить -счетчик цикла на 1 

: перейти к-следующей-итерации 

: асталивь ли в массиве-истечнико 

; необработанные двойные-слова? 

; нет, выйти из процедуры 

: Да, “повторить „цикл Для.ДвОЙНых слов 
‚флаг направления ->-увеличение 

; адресов . 
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пехё_гетатпаег: 


поуза ; скопировать двойное слово из 
; массива-источника в приемник 
дес ЕСХ : декремент счетчика цикла 
372 пех гета1паег ; если не равен 0. на следующую 
; итерацию 
ех1*: 
рор ЕВР 
геё 
_сору_пюуа епар 
епа 


Остановимся на анализе некоторых важных моментов в выполнении проце- 
дуры. Команды поуд в качестве одного из операндов используют ММХ-регистр, 
в данном случае — регистр ММО. Хочу обратить ваше внимание на то, что приня- 
тое обозначение ММХ-регистров (ММО -— ММ7) в макроассемблере МА$М совпадает 
с мнемоникой, принятой фирмой Пие|. В других компиляторах ассемблера, вооб- 
ще говоря, обозначения для ММХ-регистров могут быть другими. 

В процессе копирования команда тоуд оперирует двумя двойными словами 
(8 байт). Количество двойных слов в массиве-источнике может быть кратным 
или не кратным 2, и от этого будет зависеть способ копирования. При количестве 
элементов, кратном 2, все операции копирования могут быть выполнены коман- 
дой тоуд, иначе потребуются дополнительные операции копирования, но с ис- 
пользованием обычных команд поу и поуз4. 

Например, если массив содержит 10 двойных слов, то количество учетверен- 
ных слов равно 5. В этом случае в счетчик основного цикла помещается число 5 
и выполняется такое же количество операций копирования с помощью команд 

поуд ММО. [ЕЗГ] 

моуа [Е01}. ММО 

После этого происходит выход из процедуры. Представим ситуацию, когда 
массив содержит, например, 11 двойных слов. В этом случае количество учетве- 
ренных слов равно 5 плюс одно двойное слово. Следовательно, нужно обработать 
5 учетверенных слов с помощью ММХ-команд и одно двойное слово обычным 
образом. Для обработки оставшихся двойных слов используется дополнитель- 
ный цикл из команд 

пех _гета1пдег: 

пЮу$4 


Чес ЕСХ 
Зпг пехе гета1пдег 


Определить, нужен ли дополнительный цикл, можно с помощью команд 

стр Е0Х. 0 

3е ее 

И последнее. В исходном тексте процедур, использующих ММХ-расширение, 
обязательно должна прсутствовать директива .ММХ, позволяющая обрабатывать 
соответствующие команды. Хочу еще раз обратить внимание на то, что компиля- 


торы МАЗ$М первых версий даже при наличии директивы .ММХ команды этого 
расширения не обрабатывают! 


132 Глава 7 » Операции со строками и массивами 


Дальнейшим усовершенствованием процессоров Ниуе! Репбит стало появле- 
ние в составе процессора модуля 55Е, позволяющего выполнять параллельную 
обработку чисел с плавающей точкой. Данная технология позволяет работать со 
128-разрядными значениями, для чего в аппаратную архитектуру процессора 
включены восемь 128-разрядных регистров, которые обозначаются как ХММ0 — ХММ7. 
Мы рассмотрим более подробно эту технологию в следующих главах, сейчас же 
остановимся на одной из команд 55Е-расширения, а именно — моуирз. 

Эта команда чрезвычайно полезна для быстрого копирования и перемещения 
больших объемов данных. Она позволяет переслать 128-разрядный операнд из 
источника в приемник. В качестве источника и приемника может выступать либо 
один из регистров ХММ, либо 128-разрядная ячейка памяти. При пересылке 
данных эта команда не требует выравнивания данных по 16-байтовой границе, 
что упрощает ее применение. Как и для только что рассмотренной команды поуд, 
компилятор МАЗ$М должен поддерживать 55Е-расширение (версия 7.10.ххлх). 
Обозначения ХММ-регистров (как и ММХ) для компилятора МА$М совпадают 
с мнемоникой пбе|, но другие компиляторы могут иметь свои обозначения. 

Команда тоуирз является еще более мощной, чем тоуд, поскольку обеспечивает 
пересылку в два раза большего объема данных за одну операцию. Кроме того, 
поскольку модуль 55Е является отдельным функционально законченным аппа- 
ратным узлом процессора, обработка данных в нем выполняется параллельно 
с центральным процессором, что значительно повышает производительность 
программ, работающих по этой технологии. Рассмотрим пример использования 
команды тоуир$ для быстрого копирования содержимого одной области памяти 
в другую. В исходном тексте ассемблерной процедуры (назовем ее _поуирз_сору) 
обязательно должна присутствовать директива .ХММ. Программный код процеду- 
ры показан в листинге 7.7. 


Листинг 7.7. Копирование данных 16-байтовыми блоками с помощью команды тоуурз 
(32-разрядная версия) 


.686 
.тюде] Рае 
„ХММ 
орЛоп сазетар: попе 
.Чафа 

а1 00 -7.8.-6.5.-3.-8.-3.33.21.-13.61.-1.11.-44,-970,-22.77.-901 
Теп ЕСИ $-а1 

а2 00 1еп 0Р(0) 
.соде 
_тю\ир$_сору ргос 

ризй ЕВХ 

1еа ЕЗГ. а\ 

Теа ГОГ. а2 

поу ЕСХ. 1еп 

нк ЕСХ. 2 

моу ЕВХ. 4 

моу ЕАХ, ЕСХ 

хог ЕОХ, ЕОХ 

91, ЕВХ 

моу ЕСХ. ЕАХ 
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пехе_16: 
моуир$ ХММО. [ЕТ] 
тмоуир$ [ЕВГ]. ХММО 
а49 ЕЗГ. 16 
а9а ЕБТ. 16 
дес ЕСХ 
302 пех 16 
стр ЕБХ. 0 
Де ехи 
моу ЕСХ. ЕБХ 
с1а 
гер пю\з9 
ех{: 
Теа ЕАХ. а2 
рор ЕВХ 
ге 
_тюмир$_сору епар 
епа 

Процедура позволяет выполнять копирование произвольного количества эле- 
ментов из источника в приемник. В данной реализации источником данных явля- 
ется массив а1, содержащий 18 двойных слов, а приемником — массив а2. Для ис- 
пользования команды тоуир$ необходимо копировать по четыре двойных слова 
(16 байт) за одну операцию. Если массив двойных слов содержит число элемен- 
тов, кратное четырем, например 4, 8, 32 ит. д., то операцию копирования можно 
выполнить в одном цикле, в котором счетчик цикла кратен четырем. Например, 
если`в массиве имеется 8 двойных слов, то счетчик цикла нужно установить рав- 
ным 2 и выполнить две операции копирования по 4 двойных слова. 

Если массив содержит произвольное, не обязательно кратное четырем число 
элементов, как в нашем примере, то после окончания цикла копирования по 
16 байт оставшиеся двойные слова можно скопировать командой тоу54. Напри- 
мер, в нашем случае потребуется 4 цикла копирования (4 двойных слова х 4) 
плюс отдельное копирование двух двойных слов. Несмотря на необходимость 
выполнения дополнительных операций копирования, для больших массивов вы- 
игрыш в быстродействии будет очень большим, если используется команда по\уирз! 
Например, для массива из 5987 двойных слов можно выполнить 1496 итераций 
с командой тоуирз и отдельно скопировать 3 двойных слова командой гер поуз4, 
поместив в счетчик на регистре ЕСХ значение 3. 

Для нашего случая выполняется 4 итерации копирования в цикле с меткой 
пехе_16 и копирование двух двойных слов с помощьо команды гер по\у$4. 

Последние две процедуры копирования с определенными изменениями могут 
быть использованы как в программах на ассемблере, так и в приложениях, напи- 
санных на языках высокого уровня (С++, Рабса|). Здесь хотелось бы более под- 
робно остановиться на этом вопросе. 

О способах взаимодействия процедур на ассемблере, содержащихся в отдель- 
ных объектных модулях, и приложений на языках высокого уровня мы погово- 
рим более подробно в следующих главах. Сейчас же нам нужны только самые не- 
обходимые сведения, чтобы понять смысл приведенного далее программного 
кода на языке высокого уровня (в данном случае У150а| С++ МЕТ). 
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Проверку работоспособности 32-разрядного ассемблерного кода лучше и бы- 
стрее всего провести на работающем приложении, написанном на языке высокого 
уровня. Это позволяет легко получить визуальный результат работы программы, 
что чрезвычайно важно. Такое приложение может быть очень простым и состоять 
из нескольких строк программного кода, так, чтобы любой программист, в том 
числе начинающий, мог легко в нем разобраться и воспроизвести. 

Лучшим выбором здесь является компилятор С++, вернее, версия М!сгозой 
\У!виа[ С++ МЕТ. Хочу добавить, что при использовании других современных 
компиляторов языка С++ исходный текст приведенных программ не изменится. 
Здесь и в последующих главах для 32-разрядных процедур на ассемблере будут 
приводиться исходные тексты вызывающих их программ на С++. 

Процедура на ассемблере и программа на языке высокого уровня взаимодей- 
ствуют следующим образом: 


® ассемблерная процедура должна быть предварительно объявлена в програм- 
ме на языке высокого уровня, при этом должны указываться параметры 
и возвращаемое значение; 


» параметры в вызываемую процедуру передаются через стек справа налево, 
то есть самый правый параметр имеет наибольшее смещение в стеке; 


» процедура возвращает результат в регистре ЕАХ (значение или адрес). 


Параметры в процедуру можно передавать через стек, но для их извлечения 
удобнее использовать не регистр стека ЕЗР, а регистр ЕВР. Процедуру _томир сору 
несложно включить в простую консольную программу на \1зиа! С++ МЕТ, ис- 
ходный текст которой показан в листинге 7.8. 


Листинг 7.8. Демонстрационная программа для процедуры _то\ир$_сору из листинга 7.7 


ЯНисТиде <$%41о.1> 
ехфеги "С" 1пЕ* тоуирз_сору(\019):; 
17% та1п(\018) 


11* р1иё = пюуирз_сору(): 
рг1пТ("тюуцр$ ехатр]е: "): 
Фог (118 11 =0: 11 < 18: 114+) 


ретпЕР( "84 ". *р1иф++): 
} 


гефигп 0: 


} 


Для использования процедуры в приложении на С++ нужно объявить ее 
внешней с директивой ежеги: 


ехкегпт "С" 11%* тоуирз_сору(у01а); 


После этого требуется включить объектный модуль, содержащий процедуру 
_тоуирз_сору, в состав проекта. Результатом выполнения программы будет вывод 
на консоль строки, отображающей элементы массива а2: 


пюуир$ депо: -7 8 -65 -3 -8 -3 33 21 -13 61 -111 -44 -970 -22 77 -901 
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7.2. Сравнение строк и массивов 


Операция сравнения строк и массивов может выполняться как с помощью обыч- 
ных команд ассемблера, так и с использованием специальной цепочечной коман- 
ды стрз. Команда стрз сравнивает содержимое одной области памяти (адресуемой 
регистрами 05:51 или ЕЗГ) с содержимым другой области памяти (адресуемой ре- 
гистрами Е5:01 или ЕОГ). В зависимости от значения флага ОЕ команда стр5 также 
увеличивает или уменьшает адреса в регистрах Е51 (51) и ЕП! (ОГ) на 1 для байта, 
на 2 для слова и на 4 для двойного слова. Команда стрз воздействует на флаги АР, 
СЕ, ОЕ, РЕ, 5Е и 2Е. При использовании префикса гер регистр ЕСХ (СХ) должен со- 
держать количество сравниваемых переменных, при этом команда стр5 может 
сравнивать любое число байтов или слов. 

При выполнении команды стрз (а также 5са5) возможна установка флагов со- 
стояния так, чтобы операция могла завершиться сразу после обнаружения необ- 
ходимого условия. 

Работу команды спрз демонстрирует следующий пример, представляющий со- 
бой 16-разрядное приложение М$-ОО$. Программа сравнивает содержимое двух 
символьных строк и отображает результат сравнения на экране дисплея. Исход- 
ный текст программы показан в листинге 7.9. 


Листинг 7.9. Сравнение двух символьных строк (16-разрядная версия) 


„тюде] зта11 
‚ЗФаск 
.Чафа 
$гС ОВ "РТВУТ $ТВЕб 1" 
1$гс ЕОУ  $-$гс 
95% 08 “ЕТВУТ УТВТМб 1" 
едиа1 ОВ "5119$ аге едиа1". '$*' 


поп_еа ОВ "5{г1п9$ аге по едиа1". '$' 
.соде 
Збаг: 

пу АХ. @да{а —:; инициализация сегментных регистров 

ту 0$. АХ 

му Е5. АХ 

с19 : установка флага направления ОЕ для 

; инкремента адресов 

1еа $1. $гс ; адрес источника -> 05:51 

Теа ОТ. 95% : адрес приемника -> ЕЗ:0Т 

ту СХ. 15$гс : количество сравниваемых байтов -> СХ 

гере стр$Ь : попарное сравнение байтов 

4е уе : строки одинаковы? 

1еа 0Х. поп_ед : нет. отобразить соответствующее сообщение 

Зир оцёриё 
уез: : да. отобразить сообщение 

Теа ОХ, едиа1 
ори: 

оу АН, ЭП 

11 21 

оу АХ, 4с00И 

11 218 

еп $фаге 


епд 
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Сравнение строк в 32-разрядном приложении выполнить сложнее. Соответст- 
вующий программный код реализован в виде процедуры _сотраге_51г1пд$, исход- 
ный текст которой представлен в листннге 7.10. 


Листинг 7.10. Сравнение символьных строк (32-разрядная версия) 


.586 
„моде? ЕТаф 
ор&1оп сазетар: попе 
.Чата 
поф_едиа1 ОВ "МОТ едиа1" 
ов 0 
едиа] ОВ "Едиа1" 
ов 0 
‚соде 
_сотраге_$г1п9$ ргос 
ризп ЕВР 
поу ЕВР. ЕЗР 
тоу ЕОГ. дога рАг [ЕВР+16] : адрес первой строки -> ЕБТ 
тмоу ЕЗТ, бога р&г [ЕВР+12] : адрес второй строки -> Е$1 
моу ЕСХ, дога рёг [ЕВР+8] : размер строки -> ЕСХ 


с1а ; установить флаг направления 
; для инкремента адресов 
гере стрзЬ ; сравнение элементов строк 


34е $ е9иа1$ 

1еа ЕАХ. поё_едиа] 

эр ех 
$_е9иа1$: 

Теа ЕАХ. едиа] 
ех1(: 

рор ЕВР 

ге 
_сотраге_$г1п9$ епар 
епа 


Проверить работоспособность процедуры можно на примере простой про- 
граммы, написанной на \15иа] С++ МЕТ (листинг 7.11). 


Листинг 7.11. Демонстрационная программа для процедуры копирования 
строк из листинга 7.10 

исТиде <${910.1> 

ЯтисТиде <$%г1пд.Н> 

ехбегп "С" спаг* сотраге_$%г119$(1и® 1еп, спаг* $гс, спаг* 45%); 

11 ма1п(\019) 

{ 

спаг *5гс = "Му $&г1иа С": 

сНаг *0$6 = "Му 5%&г1ид с"; 

рг1пе+("Сотраг1пд гези]*: %$\п", сотраге_$%г1п9$ ($и1еп($гс), згс, 4$%)): 
гефиги 0: 


} 


При использовании команд стр следует учитывать, что сами строки могут 
иметь разный размер. Если строка-источник меньше, чем строка-приемник, то 
флаг СЕ устанавливается в 1. Если строки равны, то флаг 22 = 1. Если строка- 
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источник больше, чем строка-приемник, то СЕ = 0 и 72 = 0. Правильно установить 
равенство-неравенство строк — задача непростая, и нужно быть очень внима- 
тельным при выборе критерия равенства. Далее рассмотрим исходный текст не- 
большой программы, позволяющей показать различные ситуации, возникаю- 
щие в процессе сравнения. Это простое 16-разрядное приложение (листинг 7.12). 


Листинг 7.32. Сравнение строк по различным критериям (16-разрядная версия) 


„пюде] $та11 

.Чафа 
$ГС ОВ "5ТВТ№6 З2Х" 
95% ОВ "5ТЕТ№6 32Х" 
]Теп ЕСИ $-9$% 
ед! ОВ бан. бай, "56г1пд$ аге едиа1$" 
пед ОВ бан. бан, "5&г1пд аге Ч1ЕРегеп$" 
1е5$ ОВ 0ан. бай, "Згс 1е$$ {Пап 0$&$" 
дгеаё ОВ 04п. бан. "Згс дгеаф {Пап 0$%$" 


.соде 
$фаг: 
поу АХ. @аата 
мои 0$. АХ 
у Е5, АХ 
с14 
}еа 5Г. $гс 
Теа ОГ. 45% 
поу СХ. Теп 
гере стрзЬ 
34е зе 
зле поф е4 
Змр ех 
$_е4: 
]Леа 0%. ед] 
Эр $Пом 
$гс_1е55: 
1еа 0%. 1е$$ 
Эр $пом 
$гс_дг: 
Леа 0Х. дгеае 
Эр $Пом 
по _ед: 
1еа 0Х. пед 
оу АН, 9 
ие 2 
А) $ис_1е$$ 
да $гс_9г 
Дллр ех 
$Вом: 
моу АН. ЭН 
1 2 
ех: 
тоу АХ, 4<008 
те 21 
епа — $фагё 


епа 
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При том содержимом, что указано для строк $гс и 45%, программа выдает сооб- 
щение 


$4г119$ аге едиа1 


Если мы изменим строку $гс, добавив в ее конец какой-нибудь символ, напри- 
мер Х, то строки $гс и 45% будут иметь разный размер, но по-прежнему при запуске 
программы будет выдаваться сообщение о равенстве строк. Дело в том, что ко- 
личество сравниваемых символов 1еп, которое помещается в регистр СХ, остается 
неизменным и равным размеру строки 495+. В этом случае первые 1еп символов 
обеих строк одинаковы, поэтому результат сравнения остается неизменным. 

Если при равенстве размеров строк хотя бы два символа будут различаться, то 
программа выдаст одно из следующих сообщений: 


$%г1п9$ аге 91ЕРегеп\ ! 
$гс 1$ дгеафег +Пап 05% 


ИЛИ 


$4г119$ аге @1ТРегепе ! 
$гс 1$ 1е5$ {Пап 05% 


Может возникнуть и ситуация, при которой строка-приемник будет больше 
по размеру, чем строка-источник, например: 


. Дака 

$гс ОВ "5ТВ1Мб З2Х" 
95% ОВ "5ТЕТМб З2Хм" 
]Леп ЕСИ $-95& 


В этом случае при продвижении указателей адресов памяти, находящихся в ре- 
гистрах 05:51 и Е5: 01, последним элементом строки 45% будет символ И, а послед- 
ним элементом 5гс — какое-либо произвольное значение из диапазона 0-255 (ес- 
ли интерпретировать байт как беззнаковое число). Результат сравнения, таким 
образом, окажется непредсказуемым (если до того не возникнет ошибка доступа 
к памяти). 

Наилучшим выходом из такой ситуации, позволяющим избежать ошибок, 
может быть следующий алгоритм: вначале определяется размер строк источника 
и приемника, и, если они равны, выполняется операция сравнения. Если строки 
различаются по размеру, то понятно, что они не равны и сравнение проводить не 
нужно. В листинге 7.13 показан вариант 16-разрядного приложения, иллюстри- 
рующего эту методику. 


Листинг 7.13. Улучшенная версия программы из листинга 7.12 


.тюбе] $та11 
„дата 
гс ОВ “5ТЕТМа 1" 
Теп$ ЕЙЦ $-$гс 
954 08 "УТ 1" 
Тепа ЕСМ $-95% 
ет 08 бай, бан. "54г1пд$ аге едца! ! $" 
пед 08 Оп. бай. "5%г4пд$ аге Ч11Тегепе !$" ` 
ЧЕ 1еп ОВ "5{г1п9$ Паме а @1РТегепе Тепдфи!$" 
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пу АХ. @дата 
моу 0$. АХ 
ту Е5. АХ 


оу АХ. 1еп$ 

стр Ах, 1епа 

4е 90 сотраге 

1еа ОХ. Ч11Р Теп 

тр о пом 
9о_сотраге: 

Теа 5Т. $гс 

Леа 01. 9% 

ту СХ, Теп$ 

гере стрзЬ 

4е за 

1еа ОХ. пед 
ЗПом: 

у АН. 9 

те 21 

дир ех 
$_е4: 

]1еа ОХ. ед] 

Эр $Ном 
ех: 

пу АХ. 4000 

1% 21 

еп@  $фаге 

епд 


В этой программе вначале производится сравнение размеров операндов: 


ЮУ АХ. Теп$ 
стр АХ. 1епа 


После этого, в зависимости от результата, выполняются соответствующие 
действия. 

До сих пор мы рассматривали строки, размер которых определен заранее. Про- 
анализируем, каким образом можно работать со строками другого типа, а именно 
со строками с завершающим нулем. Напомню, что в конце таких строк помещает- 
ся 0, по которому и определяется конец строки. 

Для того чтобы сравнивать такие строки в ассемблерных программах, нужно 
вначале определить размер строки, после чего перейти к операции сравнения. 
Ассемблерные процедуры сравнения строк с завершающим нулем часто исполь- 
зуются программами на языках высокого уровня для быстрой обработки строк. 
Рассмотрим 16-разрядное приложение, демонстрирующее обработку строк с за- 
вершающим нулем. Исходный код программы представлен в листинге 7.14. 

Исходный текст программы несложен и не нуждается в подробных объяснени- 
ях. Замечу лишь, что размер строк вычисляется как разность начального и конеч- 
ного адресов: для строки-источника $гс начальный и конечный адреса определя- 
ются регистрами ОХ:СХ, а для строки-приемника 451 — регистрами ВХ:АХ. 
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Листинг 7.14, Обработка строк с завершающим нулем (16-разрядная версия) 


„тоде] $та11 
.Дафа 

$7С ОВ 
95% 08 
$_е4 


$_пе 
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"ЭТА 11", 0 

"ЭТВМб 117", 0 

ОВ "54"119$ аге едиа1$" 

ОВ "5{г1п9$ аге по едиа1$" 


$12е_411 ОВ "5%г1пд$ Пауе Ч11Регепе $12е !$" 


.соде 
Збагс: 
моу АХ, 
поу 0$, АХ 
моу Е5, АХ 
]1еа $1. $гс 
моу ОХ. $1 
моу АБ, 0 
5ис_ада1п: 
стр АЁ. [$1] 
3е  спеск а“ 
1ис 51 


Зир $гс_адали 
сНеск_4$%: 
Леа 01, 95% 
тоу ВХ. 01 
95% адатп: 
стр АЁ. [01] 
3е сПеск_$12е 
тис 01 


Эр 49$ адат 
спеск_$12е: 

моу СХ. $1 

$6 СХ. 0Х 


моу АХ, 01 
$46 АХ. ВХ 
$46 АХ. ВХ 
стр АХ. СХ 
4е сотраге 


тр $бом 
сотраге: 

с1а 

моу. 5Г. 0Х 

моу ОГ. ВХ 

гере стр$Ь 

де еда 

1Леа ОХ. $ пе 

Змр $Пом 
едиаТ: 

1еа 0Х. зеа. 
$Пом: : 


: начальный адрес строки-источника -> $1 
‚ сохранить начальный адрес в регистре ОХ 
: символ для сравнения -> АЁ 


: достигнут конец строки? 

: да. проверить строку-приемник 

; нет, конец строки не обнаружен. перейти 
; к следующему адресу 


: начальный адрес строки-приенника -> 01 
; сохранить начальный адрес в регистре ВХ 


: достигнут конец строки? 

; да. сравнить размеры строк 

: нет. конец строки не обнаружен. перейти 
; к следующему адресу 


: конечный адрес строки-источника -> СХ 

; вычислить размер строки-источника как разность 
; конечного. и начального адресов 

: конечный адрес строки-приемника -> АХ 

; вычислить размер строки-источника как разность 
; конечного и начального адресов | 
: размеры строк равны? р 

: да. сравним строки 

Леа ОХ. $12е_911Р ; 


нет, отобразить сообщение 


; установить флаг направления для инкренента адресов 
; начальный адрес строки-источника -> $1 
: начальный адрес строки-приемника -> ОТ: 


сравнить строки 


; строки равны? | 
; нет. отобразить соответствующее сообщение 


: да. отобразить соответствующее сообщение 
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оу АН, 9! 
116 21 

оу АХ, 4с008 
118 21 

еп зфаге 

ета 


Подобный пример для 32-разрядных приложений немного сложнее. Рассмот- 
рим исходный текст процедуры (назовем ее _стрзЬ 32), принимающей в качестве 
параметров адреса строк и возвращающей адрес строки с результатом сравнения 
(листинг 7.15). Такую процедуру можно использовать как в 32-разрядном прило- 
жении на ассемблере, так и в программе на одном из языков высокого уровня 
(С++, Разса!). 


Листинг 7.15. Сравнение строк (32-разрядная версия) 


.686 
„тоде] Раф 
орё1оп сазетар: попе 
„Чата 
5_е4 ОВ "5${г1пд$ аге едиа1",0 
$_пе ОВ "$1г1п9$ аге поф едиа1".0 
$12е_Ч11Р ОВ "54г1пд$ Пауе Ч1ТРегепе $12е !".0 
.соде 
_стрзЬЗё ргос 
ризй ЕВР 
моу  ЕВР. ЕЗР 
тоу  ЕЗГ. Фмога рёг [ЕВР+12] : адрес строки-источника 
мои  ЕОХ. ЕЗГ 
пои  ЕАХ, 0 
$гс_ада?п: 
стр ЕАХ. [ЕП] 
3е  спеск дя 


11с Е 
Эр  згс ада?тт 
спеск_95%: 
тои  ЕОГ. дога рёг [ЕВР+8] ; адрес строки-приемника 
тоу  ЕВХ. ЕбТ 
95%_адатп: 


стр  ЕАХ, [ЕОГ) 
де спеск_512е 


тс Е01 

ур 951 ада?п 
сНеск_$12е: 

мои ЕСХ. ЕЗ1 

$6  ЕСХ. ЕОХ 

тоу  ЕАХ. ЕО] 

зи  ЕАХ. ЕВХ 

стр  ЕАХ. ЕСХ 

}3е  сотраге 

1Теа  ЕАХ., $12е_ 11 

Чар  ех\ 
сотраге: 

с14 


продолжение :5^ 
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Листинг 7.15 (продолжение) 
оу Е5Г. ЕОХ 
ту ЕОГ, ЕВХ 
гере стрзь 
)}3е едьа1 
Теа ЕАХ, $ пе 
др ехи 

едиа1 : 
1еа ЕАХ. $ е4 

ех1т: 
рор ЕВР 
ге 

_стрзЬЗё епар 
ета 


Программа, вызывающая эту процедуру, может быть, например, такой (\151а1 
С++ МЕТ), как показано в листинге 7.16. 


Листинг 7.16. Демонстрационная программа для процедуры из листинга 7.15 
ЯАпс1 иде <$%910.Н> 

ехёегп “С” спаг* стр$ЬЗ2(спаг* $гс, спаг* 4${); 

11 ма1п(\019) 


саг *$1 = "фид 31"; 

спаг *$2 = "5г1ид 31"; 

рг1иЕЁ(": %5\п". стр$632($1, $2)); 
гегигп 0: 


} 


Различные манипуляции со строками и массивами, как уже упомииалось, 
можно реализовать и без команд строковых примитивов. Не является исключе- 
нием и сравнение строк. В альтериативном программном коде обычно использу- 
ют команду стр, с помощью которой в цикле выполняется попарное сравнение 
элементов строк. В качестве примера можно привести 16-разрядное приложение, 
исходный код которого представлен в листинге 7.17. 


Листинг 7.17. Сравнение строк при помощи обычных команд ассемблера 

({16-разрядная версия) 

„модей $та11 

„ЗФаск 

„дата 
$гС ОВ "ЕТАЗТ ТА 1" 
15гс ЕО $-$гс 
9$ 08 “ЕТВУТ ЭТА 2" 
едиа! 08  "ЕЧЦАЁ". '$' 
поп_ед ОВ “МОТ едиа1", '$' 

.соде 

$фагт: 
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ту СХ. 15$гс 


ту АЁ. [$Г] 

стр Аё. [017 

3е пех стр 

1Теа 0Х. поп_ед 

р ошрш 
пехё_стр: 

Тис 51 

11с 01 

1оор ада1п 

Теа 0Х. едиа1 
ошёрий: 

тоу АН, ЭП 

118 211 

тоу АХ. 45001 

т 21 

еп@ таг 

епа 


Здесь сравнивается содержимое регистра АЁ, в который помещается байт 
операнда-источника, с содержимым операнда-приемника, адресуемого регист- 
ром ЕО. В зависимости от результата сравнения происходит переход на нужную 
ветвь программы, что и выполняется следующим фрагментом кода: 

тоу АЁ. [$1] 

стр АЕ, [0Г] 

)е пехё_стр 

Операции сравнения выполняются в цикле, счетчик которого находится в ре- 
гистре СХ. Если произощел обычный выход из цикла (по достижении счетчиком 
значения 0), то это означает, что строки равны и можно вывести соответствующее 
сообщение: 

Тоор ада1п 

1еа 0Х. едиа1 


В последних поколениях процессоров появился ряд команд, позволяющих 
повысить производительность приложений. Мы рассматривали такие команды 
в главе 5. Следующий пример демонстрирует, как можно сравнить строки и одно- 
временно обеспечить высокую скорость выполнения программ, если использо- 
вать одну из таких команд, а именно споуе. В этой процедуре (назовем ее _еа_Бу\е$) 
присутствует только один условный переход, остальная часть программного кода 
выполняется линейно. Программный код процедуры сравнивает элементы строк 
$1 и $2 и сохраняет одинаковые символы строк в строке 451. В этой процедуре ис- 
ключены лишние ветвления, что может обеспечить более высокую производи- 
тельность работы программного кода. 

Хочу уточнить, что команда стоуе включена в систему команд процессоров 
Репиит П и выше, поэтому с более ранними моделями процессоров программный 
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код работать не будет. Исходный текст 32-разрядной процедуры показан в ли- 
стинге 7.18. 


Листинг 7.18. Выбор одинаковых элементов из двух символьных строк (32-разрядная версия) 
. 686 
.поде] РТа+ 
орё1оп сазетар: попе 
„Дата 
$1 ОВ "Тез УТ" 
1еп ЕСУ $-$1 
$2 ОВ "ТЕЗТ $ТЕМ@" 


; первая строка 
; размер строки 
;: вторая строка 


954 08 11 ПШР('').0 : результирующая строка 
.соде 
_е4_Буфез ргос 
ризй  ЕВХ 
Теа ЕЗ1, $1 : адрес первой строки -> Е$1 
Теа ЕОТ. $2 ; адрес второй строки -> ЕбТ 
Теа ЕОХ. 945% ; адрес результирующей строки -> ЕОХ 
поу ЕСХ. 1еп : размер строки -> ЕСХ 
пехё: 
оу ВЕ. '-' : исходное значение -> В( (вместо 
: символа '-’ можно взять другой). 
ту — АЕ. [Е51] ; символ из строки-источника -> АЕ 
стр АЕ. [ЕТ] : сравнить с символом в той же позиции 
: строки-приемника 
стоуе ЕВХ. ЕАХ ; @сли символы равны. поместить в регистр ВЕ 
; символ из АЁ 
поу Буфе рёг [ЕОХ]. ВЁ ; сохранить символ на соответствующей 
; позиции в результирующей строке 
тис ЕЗ1 ; адрес следующего символа источника -> ЕЗГ 
1пс ЕО : адрес следующего символа приемника -> ЕОТ 
11с ЕОХ ; адрес следующего символа 
; строки результата -> ЕОХ 
100р  пеж ; переход к следующей итерации 
Теа ЕАХ. 95% : адрес результирующей строки -> ЕАХ 
рор ЕВХ 
геф 
_е4_Буфе$ епар 
епа 


Алгоритм процедуры достаточно прост, хочу лишь заметить, что команда стоуе 
не работает с 8-разрядными регистрами, поэтому пересылка данных происходит 
из 32-разрядного регистра. 

Процедура возвращает в вызывающую программу адрес строки, содержащей 
результат. Результирующая строка 454 после выполнения процедуры будет со- 
держать строку 


Т--- ЗТАМб 
Используя исходный код предыдущего примера, можно создать эффективную 


процедуру для сравнения элементов двух массивов целых чисел. Такую процеду- 
ру назовем _е4_Фмогаз, а ее исходный текст представлен в листинге 7.19. - 
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Листинг 7.19. Выбор одинаковых элементов из двух целочисленных массивов 
(32-разрядная версия) 
.686 
„ю4е] Наф 
орЁоп сазетар: попе 
„Чака 
пит? 00 4562. 1094. -502. 902 
1еп  ЕСУ $-пит1 
пит? 00 2341. 1094, -502. 87 
45% 004 01Р(0) 


.соде 

_е9_9мог4$ ргос 
ризп  ЕВХ 
]еа ЕТ. пит1 
Теа ЕОТ. пита 
]еа ЕОХ. 95% 
ту  ЕСХ. 1еп 

пех: 
оу ЕВХ. 0 


у АХ. [Е51] 
стр  ЕАХ. [ЕО] 
стоуе ЕВХ. ЕАХ 

поу  ГЕ0Х]. ЕВХ 


а99 — ЕЗГ. 4 
а99 ЕО. 4 
а94  ЕОХ. 4 
]100р пех 
Теа ЕАХ. 95% 
рор  ЕВХ 
ге 
_е4_Фног4$ епар 
епд 


Программный код процедуры достаточно понятен, хочу лишь обратить вни- 
мание на то, что переход к следующим элементам массивов требует смещения на 
4 байта. Кроме того, при несовпадении элементов сравниваемых массивов в соот- 
ветствующие позиции результирующего массива заносятся нули. После выпол- 
нения процедуры массив 45% будет содержать следующие элементы: 


0 1094 -502 0 


7.3. Сканирование строк и массивов 


В процессе обработки текстовой информации может возникнуть необходимость 
манипулирования элементами строк или массивов. Наиболее часто выполняются 
такие операции: 


®» замена определенных символов в тексте другими, например подстановка 
пробелов вместо различных редактирующих символов (табуляции, возвра- 
та каретки и перевода строки); 
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» подсчет количества элементов строк или массивов, удовлетворяющих ка- 
кому-либо условию; 


» обработка отдельного элемента массива чисел, например вычисление мо- 
дуля числа, квадратного корня ит. д. 


Язык ассемблера обладает широкими возможностями для выполнения таких 
операций. Мы рассмотрим различные способы сканирования строк и массивов 
и начнем с использования специально предназначенной для этого команды $са$. 
Команда зсаз отличается от команды стрз тем, что выполняет просмотр строки 
или массива в поиске определенного элемента. Команда $саз сравнивает содер- 
жимое области памяти, адресуемой регистрами ЕЗ:01 или ЕТ, с содержимым реги- 
стра А+, АХ или ЕАХ. 

Операция сравнения осуществляется путем вычитания содержимого ячейки 
памяти из содержимого А! АХ или ЕАХ, с устанавлением при этом соответствующих 
флагов. В зависимости от значения флага 0Е команда $саз увеличивает или умень- 
шает адрес в регистре 01 (ЕОТ) на 1 для байта, на 2 для слова и на 4 для двойно- 
го слова. Команда $са$ устанавливает флаги АР, СЕ, ОЕ, РЕ, $ и 2Е. При исполь- 
зовании префикса гер и размера строки в регистре СХ (ЕСХ) команда 5са$ может 
сканировать строки и массивы любого размера. Эта команда особенно полезна 
при разработке текстовых редакторов, где программа должна сканировать стро- 
ки, выполняя поиск знаков пунктуации. 

В приведенной в листинге 7.20 программе выполняется сканирование стро- 
ки гс, и символ пробела заменяется символом +. Программа реализована как 
16-разрядное приложение и выводит на экран содержимое строки $гс после пре- 
образования. 


Листинг 7.20, Поиск символа пробела в строке (16-разрядная версия) 


.поде] $та11 

.5фаск 100и 

.дафа 

згс ОВ " ТЕЗТ $ТАА@ !$" 
]Теп ЕСУ $-5гс 


.соде 

$фагт: 
ЮУ АХ. @дата 
поу Е. АХ 
оу 05$. АХ 
Теа 01. $гс 
по\ СХ. 1еп-1 
с14 
оу АЕ. '' 

пех: 
зсазь 
3е сЛапде 
100р  пеж 
Теа 0Х. $гс 
моу АН, ЭП 
11% 211 
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спапде: 
оу Буе рёг [01-1]. '+' 
дес СХ 
р пех 
ех1{: 
оу АХ. 4с008 
17% 218 
епа ЗфагЕ 
ета 


Команды сканирования данных позволяют реализовывать довольно слож- 
ные алгоритмы простыми средствами. Предположим, нужно подсчитать коли- 
чество слов в данном фрагменте текста при условии, что в качестве разделителя 
используется символ пробела. В листинге 7.21 приводится простое 16-разрядное 
приложение, позволяющее выполнить такой подсчет и вывести результат на 


экран дисплея. 


Листинг 7.21. Подсчет количества слов во фрагменте текста (16-разрядная версия) 


„тлодей $та11 

орЕ1оп сазетар:попе 

„ата 
$1 ОВ " ТЕЗТ: Е1г5& мога зесопа мога {ига мога ОК 
]еп ЕДУ $-$1 
159 08 “Митрег оф мог@$ = " 


спе ов 0 
в ‘'$°’ 
.соде 
$фагт: 
му АХ. @даа 
ту 0$, АХ 
ту  Е$. АХ 
му СХ. 1еп : размер строки -> СХ 
1еа ОГ. $1 ; адрес первого злемента строки -> 01 
му А. '' : символ-разделитель -> АХ 
с14 : инкремент адреса для последующих операций 
пех: 
гере °сазБ : пропускаем пробелы 
4е ех1+ ; кроме пробелов. ничего нет - закончить работу 
; программы 
тс с ; обнаружено слово - увеличить счетчик слов 
герпе $са$Ь : ищем конец слова, дальше должны быть пробелы 
ле ехи : строка закончилась - выйти из программы 
Зр  пеж : поиск следующего слова 
ех\: 


ог ст, 301 —: преобразовать однобайтовое число 
: в символьный формат АЗСГТ 


1еа 0Х. п$9 ; отобразить результат 
ту АН. ЭП 

11% 211 

ту АХ. 40001 :; завершить программу 
11% 211 

епа $фаге 
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При данных параметрах строки $1 программа отобразит сообщение 
Митрег от мога$ = 9 


Следующий пример представляет собой 32-разрядную процедуру, выпол- 
няющую поиск в массиве двойных слов чисел, меньших 100, и замену таких 
чисел нулями. Исходный текст процедуры (она называется _5са$_94) представлен 
в листинге 7.22. 


Листинг 7.22. Поиск и замена чисел, меньших 100, в массиве целых чисел 
(32-разрядная версия) 


.586 
„тоде] Е]а+ 
ор&1оп сазетар: попе 
.соде 
_$са$_94 ргос 
ризп  ЕВР 
моу  ЕВР, ЕЗР 
моу ЕСХ. Чиога р&г [ЕВР+12] : размер нассива -> ЕСХ 
оу ЕОТ, Фиога рёг [ЕВР+8] :; адрес первого элемента -> ЕТ 
ЮУ ЕАХ. 100 ; сравниваемое значение 
с1а ; установить флаг направления в сторону 
: увеличения адресов 
пехё: 
$са$4 : сравниваем элементы массива 
; с содержимым ЕАХ 
39 спапае : число в ЕАХ больше текущего злемента? 
: если нет. следующая итерация 
100р пех 
др ех\ 
спапде: ; Злемент массива меньше числа в ЕАХ 


оу  Фиог@ рег [ЕО!-4]. 0 
дес —ЕСХ 


р пех 
ех1+: 
рор ЕВР 
ге 
_$са$_49 епар 
епа 


; заменить содержимое ячейки памяти на 0 
: декремент счетчика 


В этой процедуре используется тот факт, что команда $са$ после выполнения 


устанавливает флаги СЕ, АЕ, (Е и $Е, и это позволяет анализировать значения по 
принципу «больше или меньше». 

Процедуру при желании можно легко модифицировать для работы со своими 
данными и задействовать как в программах на ассемблере, так и в приложениях, 
разработанных на языках высокого уровня. В листинге 7.23 показан пример 
32-разрядного консольного приложения на \1з0а| С++ МЕТ, использующего эту 


процедуру. 


Листинг 7.23. Демонстрационная программа для процедуры из листинга 7.22 
фНпсТиде <5Е91о. > 

ехфегп "С" у014 зсаз_94(1п%* рт. 1мё 1$12е); 

11 ма1п(\014) 
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116 Заггау[7] = {794. 56. 132. 112, 32.7. 265}; 


11* р1пё = Таггау; 
$саз_Ч99(Таггау. $12е0{(1аггау)/4): 


Тог (1п6 11 = 0; 11 < $12е01(1аггау)/4: 11++) 


{ 
рее" 8А\ Е", *р1пе++); 


реп ("\ п"); 
гефигп 0; 


} 


Результатом работы этого приложения будет вывод на экран ряда чисел: 


794 0 132 11200 265 


Можно повысить производительность этой процедуры, если уменьшить коли- 
чество условных переходов. В листинге 7.24 показан модифицированный вари- 


ант процедуры _$саз_94. 


Листинг 7.24. Улучшенный вариант процедуры из листинга 7.22 


исходные значения элементов 


: массива 


: размер массива в байтах 


; размер массива -> ЕСХ 
; преобразовать в количество 


; ДВОЙНЫХ СЛОВ 


; адрес массива -> ЕБ1 

: шаблон для сравнения -> ЕАХ 
; подготовка регистра ЕОХ 

; установить флаг направления 


; для увеличения адреса 


; элемент массива -> ЕВХ 

: сравнить ЕАХ с элементом массива 
: если элемент массива больше 100. 
: обнулить его. Поскольку указатель 


: адреса после выполнения команды 
: $са$4 продвинулся на 4, необходимо 
; это учесть в команде моу 


.686 
„тю4е] Раф 
ор1оп сазетар:попе 
.дафа 
1аггау 00 23, -49, 65. 98. 133. 82; 
1еп 00 $-Таггау 
.с0де 
_$са$_99 ргос 
ЮУ ЕСХ. Теп 
`5ИГ ЕСХ. 2 
Теа ЕСТ. Таггау 
ту ЕАХ. 100 
хог ЕОХ. ЕОХ 
с14 
пех: 
ЮУ ЕВХ. Фиога рёг [Е01} 
$са$4 
стоу] ЕВХ. ЕБХ 
у  Чмога рёг [Е0Т-4]. ЕВХ 
1оор пеж 
ех1: 
1еа  ЕАХ. Таггау 
ге 


_$са$_44 епар 
ета 


`; адрес массива -> ЕАХ 
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По сравнению с предыдущей процедурой здесь сделаны следующие изме- 
нения: 


» другое условие задачи — теперь все элементы массива, большие 100, заменя- 
ются нулями; 


® вместо команд условных переходов используется команда стоу1; 


» вместо внешних параметров процедура использует данные из сегмента 
данных (массив Таггау). 


При указанных начальных значениях элементов 1аггау после выполнения 
процедуры в массиве будут содержаться следующие элементы: 


23 -49 65 98 0 82 


7.4. Использование команд |04$ и $%0$ 


Команда 1045 может загрузить из памяти один байт в регистр А!, одно слово в ре- 
гистр АХ или одно двойное слово в регистр ЕАХ. Адрес памяти определяется либо 
регистрами 05:51, либо регистром Е$Т. Как и для предыдущих цепочечных ко- 
манд, в зависимости от значения флага 0Е происходит инкремент или декремент 
содержимого регистра $1 или ЕЗТ. Эта команда используется без префикса по- 
вторения гер. 

Если сравнивать команды по\ и 104$, то при одинаковом результате тоу требует 
трех байтов машинного кода, в то время как 1045 — только одного. Команда 1045 
дополнительно требует инициализации регистра $1 или Е$1. Команда 104$ удобна 
в тех случаях, когда нужно анализировать каждый байт, слово или двойное слово 
и выполнять с ними определенные действия. Команда 1045 подойдет, например, 
при замене отдельных символов строки, для реверсирования строки, то есть 
изменения порядка следования элементов на обратный, и т. д. Команда 104$, как 
и остальные цепочечные команды, имеет модификации для работы с байтами 
(10455), со словами (1095м) и двойными словами (10454). 

Команду 1045 и ее модификации можно представить в виде нескольких других 
команд. Например, команду 10455 можно представить как комбинацию команд: 

оу АБ. [$1] 

11с 51 

Команда $105 записывает содержимое одного из регистров А", АХ или ЕАХ в байт, 
слово или двойное слово в памяти. Адрес памяти определяется регистрами Е5:01 
либо регистром ЕТ. В зависимости от значения флага 0Е команда $105 увеличи- 
вает или уменьшает адрес в регистре 01 на 1 для байта, на 2 для слова и на 4 для 
двойного слова. Команда $105, используемая с префиксом гер, позволяет ини- 
циализировать область данных какими-либо значениями, например пробелами 
или нулями. Команда $105, как и остальные цепочечные команды, имеет моди- 
фикации для работы с байтами ($1055), со словами ($105\) и двойными слова- 
ми ($40$4). 
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Команду 510$ и ее модификации можно представить в виде нескольких других 
команд. Например, команда $6056 может быть представлена в виде двух команд: 


оу [01]. А 
1пс 01 


Следующие команды эквивалентны команде гер $ф056: 


пехс: 


ЮУ [01]. АЕ : содержимое АЕ -> ячейка памяти с адресом в 01 
11с 01 | 9ес 01 :; инкремент или декремент 


Тоор пехе ; перейти к следующему элементу 


Очень часто команды 104$ и $105 используют вместе для посимвольной обработ- 
ки строк и массивов. Наш следующий пример демонстрирует это (листинг 7.25). 
Это простая программа, в которой символы строки $1 из нижнего регистра преоб- 
разуются к верхнему регистру. 


Листинг 7.25. Преобразование символов нижнего регистра в символы верхнего регистра 
(16-разрядная версия) 


„лодей $та11 
орё1оп сазетар: попе 
„дафа 
$1 08 " те$ё $1г1пд 1" 
1еп  Е0И $-$1 
8 '$' 
.соде 
ЗФаг{: 
ту АХ, @дафа 
ту 05, АХ 
ту Е5, А 
с19 ; установить флаг направления в сторону увеличения 
: адресов 
ту СХ. 1еп ; размер строки $1 -> СХ 
1еа 51. $1 : адрес первого элемента строки -> $1 
му 01. 51 ; тот же адрес -> 01 
пех: 
10456 ; загрузить символ строки $1 в регистр АЁ 
стр А. 97 : А < 'а'? 
Ъ р ; нет, вне диапазона. пропустить 
стр Ас. 122 ; А > '2'? 
За $К1р ; нет, вне диапазона. пропустить 
56 А. 32 ; преобразовать символ из диапазона 'а’-'7' 
; в символ из диапазона ‘А’ - '27* 
$К1р: 
$056 ; запомнить символ по тому же адресу 
1оор пех ; переход к следующему символу 
Злр ех\ 
ее: 
1еа ОХ, $1 ; отобразить преобразованную строку 
ту АН. ЭП 
1% 218 
ту — АХ, 40008 
т 21и 


епа ЗФаге 
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Команды 104$ и $405 можно использовать и для копирования строк, однако та- 
кой метод не очень эффективен. Более удобной в этом плане является команда 
пересылки поуз. Она считывает данные по адресу памяти, находящемуся в регист- 
ре $1 или ЕЗ1, и помещает их по адресу, указываемому регистром 01 или Е0Т. При 
этом содержимое регистров $1 (ЕЗТ) и 01 (ЕОГ) изменяется так, чтобы указывать на 
следующие элементы строк. Кроме того, команда поуз не загружает регистр-акку- 
мулятор во время пересылки. Только тоу$ и еще одна строковая команда стрз ра- 
ботают с двумя операндами памяти. Все остальные команды требуют, чтобы один 
или оба операнда находились в одном из регистров процессора. 

Рассмотрим еще один пример применения команды 1045. Процедура _соипЕ_5, 
исходный текст которой представлен в листинге 7.26, выполняет подсчет числа 
вхождений определенного символа в строке. Для этого примера подсчитывается 
количество символов 5. | 


Листинг 7.26. Подсчет количества определенных символов в строке (32-разрядная версия) 


. 686 
.тоде] 11а% 
орИоп сазетар: попе 
‚Чата 
$гс ОВ "Т№1$ $г1пд сопфа1п$ Т1уе могд$" 
]1еп  Е0У $-5гс 
сп 000 
.соде 
_соип_В ргос 
1еа —ЕЗ!, $гс 
пу  ЕСХ. Теп 
с19 
хог  ЕВХ. ЕВХ 
пех : 
109$6 
стр А. '5°' 
зе ВЕ 
294 спе. ЕВХ 
100ор пех 
1еа  ЕАХ. с 
ге 
_соип_Ь епар 
епд 


В этой процедуре подсчет символов выполняется для строки $гс. Использова- 
ние команды ее позволило избежать дополнительных ветвлений в программе 
после выполнения операции сравнения. Для подсчета количества вхождений 
символа задействован счетчик сп. Он инкрементируется всякий раз, как только 
в процессе просмотра встречается символ $. После выполнения процедуры в счет- 
чике будет находиться значение 3. 

В следующем примере продемонстрирован один из способов изменения по- 
рядка следования элементов в строке на обратный (реверсирование строки). Во 
время этой операции последний элемент строки помещается на место первого, 
предпоследний — на место второго и т. д. Существуют различные способы выпол- 
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нения такой операции. В нашем случае выберем простой вариант, при котором 
для хранения промежуточного результата используется дополнительный буфер 
памяти. В листинге 7.27 представлен исходный текст 16-разрядного приложения, 
в котором применяется подобная техника преобразования. 


Листинг 7.27. Реверсирование строки (16-разрядная версия) 
„лводей зта11 


„даба 
$гс ОВ "123 456 789$" ; строка. которую нужно реверсировать 
1еп ЕОЦ $-$гс-1 : размер строки за вычетом '$' 
{тр ОВ 11 ПЦР (208) : временный буфер для хранения данных 
.соде 
уфаг{: 
оу АХ. @дата 
у 05. АХ 
у  Е5. АХ 
ту СХ. 1еп 
$9 ; флаг ОЕ -> 1. уменьшение адреса $гс 
1еа 51. $гс : адрес преобразуемой строки -> $1 
а994 51, 1еп-1 ; установить указатель на адрес последнего 
: элемента строки $гс 
1еа ОТ. {тр ; адрес временного буфера памяти -> ОТ 
пех: 
Т09$6 : элемент строки $гс -> АЁ 
ту  Буе уг [0П. А; сохранить символ в буфере %тр 
116 01 : перейти к следующему адресу 
; в буфере &тр (инкремент адреса) 
1о00ор пех ; следующая итерация 
с14 : установить флаг ОЕ в 0 дпя 
: увеличения адресов 
у СХ. 1еп ; размер строки $гс -> СХ 
1еа 51. Ир ; адрес строки-источника -> $1 
1еа ОТ. $гс ; адрес строки-приемника -> 01 
гер  тоузЬ ; копирование из тр в $гс 
1еа 0%. $гс : вывод результата на экран 
му АН. 9 
т 21 
ту АХ, 46001 
те 2 
еп  $фаге 
епа 


Исходный текст программы несложен для понимания, поэтому остановлюсь 
лишь на некоторых моментах. Для выполнения строковых команд в сторону 
уменьшения адресов операндов флаг направления ОЕ должен быть установлен в 1. 
Кроме того, нужно правильно установить адрес последнего операнда (первого 
при выполнении операции). 

Рассмотрим еще один пример работы команды 5105 (листинг 7.28). Эта ко- 
манда очень удобна для инициализации области памяти каким-либо значением. 
В примере показано заполнение символьной строки символом Х. 
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Листинг 7.28. Заполнение области памяти определенным символом (16-разрядная: версия) 
„тоде] $та11 


. Дафа 


$1 ОВ " ТЕЗТ 5ТВ1М6$" 
Теп ЕСУ $-$1 


.соде 


Зфаг: 


оу 
оу 
оу 
с19 
тоу 
Теа 
оу 
гер 
]еа 
оу 
11% 
оу 
11% 
епд 
епд 


АХ. @дафа 
05. АХ 
Е. АХ 


; установить флаг переноса для инкремента адреса 


211 

АХ. 46000 
211 

$фаг 


; символ-заполнитель -> АЕ 

: адрес строки-приемника 

; размер строки без учета последнего символа -> СХ 
: заполнить область памяти символом ‘Х’ 

: вывод обновленной строки на экран 


Исходный текст программы прост и в пояснениях не нуждается. Массив це- 
лых чисел, представленных элементами размером в слово, можно проинициали- 
зировать нулями с помощью следующего фрагмента программного кода: 


. дата 
Таггау ОМ 34 


]Теп 


.соде 


Теа 
тоу 
$Иг 
с19 
оу 
гер 


01, 1аггау 
СХ. Теп 


. -16. 8. 33. 92. 14 
ЕОСУ $-Таггау 


7.5. Массивы строк 


Во многих случаях программисту приходится иметь дело не с отдельными стро- 
ками, а с группой, или массивом, строк. Очень часто в программах требуется, в за- 
висимости от результатов каких-то промежуточных вычислений, отображать со- 
ответствующую информацию, содержащуюся в одной из строк массива. Доступ 
к отдельным строкам массива лучше всего продемонстрировать на примере (ли- 
стинг 7.29). Это простое 16-разрядное приложение, выводящее на экран строку, 
адрес которой определяется переменной пит. 
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Листинг 7.29. Обработка отдельных строк из группы строк (16-разрядная версия) 


„юде] $та11 
.5фаск 1000 


‚Дафа 
$1 


52 08 09и. бай. "5%г1тд $2$" 
$3 ОВ 04п, бан. "5фг1пд $3$" 
за44г Табе дога 
и $1 
09 $2 
09 $3 
пит о 
.соде 
ЗФаге: 
му АХ. @Чата 
у 05, АХ 
ту  Е5. АХ 
у СХ. 3 
ада1п 
хог 51. $1 
а99 $1. пит 
$1 $1. 1 
оу ОХ, мога рёг за99г[$1] 
му АН, 9 
1% 21 
11с пит 
100р ада1п 
ех1{: 
му АХ. 4с001 
1% 21 
еп $фагу 
епа 


08 ОВ. Сан. "5%г1пд $1$" 


; содержимое строки $1 

: содержимое строки $2 

: содержимое строки $3 

; адрес массива строк за94г 

: адрес строки $1 

: адрес строки $2 

: адрес строки $3 

: начальное значение счетчика 


: подготовить индексный регистр 51 
: пут -> $1 

: вычислить смещение 

; в массиве задаг 

; поместить в ОХ адрес строки 

; и вывести ее на экран 


; инкремент счетчика для перехода 
; к следующей строке 
; следующая итерация 
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Программа очень простая, единственный момент, на котором я хочу акценти- 
ровать внимание, — алгоритм вычисления адреса строки. Каждая строка имеет 
двухбайтовый адрес (для данной программы!), поэтому массив строк 5а49г содер- 
жит три слова. Например, для получения адреса строки $2 необходимо к адресу 
массива за44г прибавить 2, а для получения адреса $3 — 4, адрес строки $1 имеет 
нулевое смещение. Для вывода строки на экран нужно в регистр ЕБХ загрузить ад- 
рес массива за44г плюс смещение строки в массиве. Смещение находится в реги- 
стре ЕЗТ и легко вычисляется с помощью команд 


хог 
&94 
$1 


УГ, $1 
УТ, пит 
УТ, 1 


Например, при значении пит = 0 регистр 51 будет содержать значение 0, что 


даст доступ к строке $1, при значении пит = 1 в $1 будет находиться 2 ит. д. 
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Принципы работы с массивами строк для 32-разрядных приложений: нас: 
семблере и языках высокого уровня демонстрирует процедура _заггау, исходный 
код которой показан в листинге 7.30. 


Листинг 7.30. Обработка группы строк (32-разрядная версия) 


.686 
‚одет 11а 
„дата 
$1 0В "К 'за 5Ег1п9д $1".0 
$2 ОВ "Неге 1$ 5&г1пд $2".0 
$3 ОВ "З4г1па $3 1$ рТасей пеге".0 
а99кг Табе] дмог9 


00 $1 
00 $2 
00 $3 
.соде 
_заггау ргос 
ризй ЕВР 
тоу ЕВР. ЕЗР 
тоу ЕСХ. ога рёг [ЕВР+8] : индекс строки -> ЕСХ 
$11 ЕСХ. 2 : преобразовать в двойное слово 
]Леа ЕЗГ. задаг ; адрес массива строк за94г -> Е51 
а94 ЕЗГ. ЕСХ ; адрес двойного слова, содержащего 
: адрес строки -> ЕЗТ 
тоу ЕАХ. [Е$Г] ; адрес искомой строки -> ЕАХ 
рор ЕВР 
ге 
_заггау епар 
епа 


Процедура принимает в качестве параметра номер строки, равный 0, 1 или 2, 
и возвращает адрес выбранной ранее строки. В качестве индексатора строки вы- 
бран регистр ЕСХ, в котором полученный номер строки умножается на 4 (адрес 
строки представлен двойным словом). В регистр Е5!1 помещается адрес массива 
строк (он совпадает с адресом двойного слова, содержащего адрес нулевой стро- 
ки). Для доступа к двойному слову, содержащему адрес требуемой строки, следу- 
ет к содержимому Е51 прибавить содержимое регистра ЕСХ. Наконец, в ‚регистр ЕАХ 
помещается адрес искомой строки. 

Эта процедура может быть вызвана из программы на У1з1а| С++ МЕТ с помо- 
щью программного кода из листинга 7.31. 


Листинг 7.31. Демонстрационная программа для процедуры из листинга 7.30 


ЗАосТиде <$4910.1> 
ехбегп “С" сваг* заггау(1иё 11): ° : | и: 
116 ма1и(у019) 


{ 
Тог (11 11-0: 11 < 3; 11++) 


{ 
ритпЕ(”: %$\п", $аггау(11)); 
} 


гефиги 0: 


} 


В этой программе в цикле ог все три строки выводятся на экран дисплея. 
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7.6. Полезные алгоритмы 


Здесь мы рассмотрим некоторые алгоритмы, которые могут пригодиться при 
работе со строками и массивами, а также ознакомимся с некоторыми командами 
ассемблера, полезными при обработке строк. 

Ранее мы рассматривали алгоритм реверсирования строк. Суть алгоритма со- 
стоит в том, что вначале меняются местами первый и последний элементы масси- 
ва, затем — второй и предпоследний и т. д. Проход по массиву (строке) выполня- 
ется с помощью двух указателей — в прямом и обратном направлениях. Обмен 
прекращается, когда значение прямого указателя становится равным или большим 
обратного указателя. 

Приведу пример программы, реализующей этот алгоритм. В программе исполь- 
зуется новая для нас команда — хсИ9. Команда хсИд пересылает значение первого 
операнда во второй, а второго — в первый. В качестве первого операнда можно 
указывать регистр (кроме сегментного) или ячейку памяти, в качестве второго — 
регистр (кроме сегментного), ячейку памяти или непосредственное значение, од- 
нако не допускается определять оба операнда одновременно как ячейки памяти. 
Эта команда очень удобна при перемещении значений и обмене значениями меж- 
ду операндами. 

В листинге 7.32 приводится исходный код 16-разрядного приложения, в кото- 
ром выполняется реверсирование элементов строки. 


Листинг 7.32. Реверсирование строки при помощи команды хспд (16-разрядная версия) 


‚людей $та11 
„Фата 
$1 ОВ "АВСОЕЕС$" 
1еп Е0Ц $-$1-1 ; в константе Теп не учитывается последний 
: элемент (‘$’). поскольку он остается на 
; месте 
.соде 
уаг: 
ОУ АХ. @Чата 
тоу 0$. АХ 
МОУ ЕЗ. АХ 
1еа $1, $1 : адрес первого 
; злемента -> $Т (прямой указатель) 
Теа ОТ. $1+1еп-1 : адрес символа 'б'’ -> ОГ (обратный 
; указатель) 
пех: 


моу АБ. Буе рёг [$Г] ; здесь выполняется обмен элементов строки. 
хси9 А. Буе рЕг [0Г] : находящихся в ячейках памяти с адресами 
оу Бубе рег [51]. АЁ ; в регистрах $Т и 01 


Тис $1 : продвинуть вперед прямой указатель 
дес 01 : уменьшить обратный указатель 
стр УГ. 01 : сравнить адреса 
и] пех : адрес в $1 все еще меньше адреса в 01 
: повторить цикл 
]еа ОХ. $1 ; преобразование закончено. вывод результата 
оу АН. ЭП 


продолжение : 
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Листинг 7.32 (продолжение) 


11% 21п 

оу АХ, 40008 
11% 21 

епа $фаг& 

епд 


`Подобным образом можно выполнить, например, реверсирование массива це- 
лых чисел. В этом случае необходимо учитывать, что следующие адреса элемен- 
тов отстоят на 4 от предыдущих. В листинге 7.33 показан пример простой проце- 
дуры (она называется _ге\32), меняющей порядок следования элементов массива 
целых чисел на обратный. 


Листинг 7.33. Реверсирование массива целых чисел при помощи команды хсНд 
(32-разрядная версия) 


. 686 
.оде1 Р1а* 
ор1оп сазетар: попе 
.соде 
_ге\уЗ2 ргос 
ризи ЕВР 
ту  ЕВР, ЕЗР 


тоу  ЕСХ. Чмог@ рёг [ЕВР+12] : помещаем размер массива 
: в двойных словах в регистр ЕСХ 


дес  ЕСХ ; вычисляем смещение последнего элемента 
$11  ЕСХ. 2 ; преобразуем смещение в байты 
моу  ЕЗГ. дмога руг [ЕВР+8] ; адрес массива 
оу  ЕОГ, ЕЗ1 
49  ЕОГ. ЕСХ 
пех: 


ту  ЕАХ, [Е5П 
хспа ЕАХ. [ЕОТ] 
у  [Е5Г]. ЕАХ 


8994 Е51. 4 
зуб Е0Г, 4 
стр ЕТ. Е] 
5 пехё 
рор ЕВР 

ге 

_геуЗё епар 

епд 


Полагаем, что процедура принимает два параметра: адрес массива (он будет 
находиться в регистре ЕВР со смещением 8) и размер массива (в регистре ЕВР со 
смещением 12). Здесь размер массива передается в двойных словах, поэтому для 
вычисления правильного смещения последнего элемента массива необходимо 
выполнить команды 


дес  ЕСХ 
$11  ЕСХ. 2 


Процедура _ге\32 не возвращает результат, а работает с буфером вызываю- 
щей программы. На языке \У15ща| С++ МЕТ результат преобразования выводится 
с помощью консольного приложения, исходный текст которого представлен в лис- 
тинге 7.34. 
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Листинг 7.34. Демонстрационная программа для процедуры из листинга 7.33 


пс]иде <5%910.1> 
ехфегп "С" у014 геуЗ2(1п+* Таггау. 11% 15126); 
11 ма1п(у014) 


{ 

118 1аггау[6] = {45, -234. 12, 98. 33. 2}; 
11ё 1$12е = $12е01(1аггау) / 4: 

1п0* рта = Таггау: 

геуЗ2(1аггау. 6): 

Тог (11 11 =0: 11 < 1$12е: 11++) 


{ 
реет" %а\Е", *рта++): 
} 


гефигпи 0; 


} 


Довольно часто программисты сталкиваются с необходимостью преобразова- 
ния каких-либо величин в другие по определенному закону. Закон может выра- 
жаться либо математической зависимостью между преобразуемыми величинами, 
либо в форме таблицы. Для второго варианта в ассемблере существует специаль- 
ная команда х1аф, которая осуществляет выборку байта из таблицы. В регистре ВХ 
должен находиться относительный адрес таблицы, в регистре АЕ — смещение в таб- 
лице к выбираемому байту. Выбранный из таблицы байт загружается в регистр 
АЕ, при этом содержимое АЁ перезаписывается. Размер таблицы может достигать 
256 байт. 

Следующий пример показывает преобразование беззнакового числа в реги- 
стре АЁ в символьное представление. Исходный код 16-разрядного приложения 
представлен в листинге 7.35. 


Листинг 7.35. Преобразование числа в символьное представление командой ха( 
(16-разрядная версия) 


„тоде $та11 
.Чафа 
{51 ОВ "0123456789" : таблица преобразования 
гез 08 2 9 (’') ; область памяти для результата 
ОВ '$' 
.соде 
$фаг: 
оу АХ. @Чата 
ту 0$, АХ 
Теа ВХ. 61 ; загружаем адрес таблицы в регистр ВХ 
1еа — $1[. гез ; адрес результата -> 51 
А ОХ. $1 : сохраняем адрес результата в регистре ОХ 
пом АЕ. 19 : десятичное число для преобразования -> АЁ 
Си ; преобразуем байт в слово 
пюу Сь. 10 : делитель -> (4 
Оу СЕ ; делим число 19 на 10 
; в результате: АЁ = ]. АН = 9 (остаток) 
х1а% ; преобразовать АЁ в символ 
МОУ Буе рёг [51], АЕ : сохранить в первом элементе строки 
хсв9° АН. АЁ : обменять байты 
х1а+ преобразовать в символ 


ЮУ Буфе рёг [$1]+1, АЁ : сохранить АЁ во втором элементе строки продолжение 
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Листинг 7.35 (продолжение) 


тоу АН. ЭП : вывести результат на экран 
11 211 

тоу АХ. 4с008 

11 21п 

епд уфаг+ 

епа 


В этой программе десятичное число 19 преобразуется в строку символов 19 и вы- 
водится на экран. Для этого содержимое регистра А+, в котором находится число, 
преобразуется в двоично-десятичное число, а затем каждый разряд такого числа 
с помощыо таблицы 161 конвертируется в символьное представление. Символы по- 
мещаются в соответствующем порядке в строку гез, после чего выводятся на экран. 


7.7. Полезные советы 


Как видим, при манипуляциях со строками можно обходиться и без специализи- 
рованных команд, однако из-за дополнительных операций инкремента-декремента 
адресов и дополнительного анализа условий равенства символов и конца строк 
код получается несколько громоздким. Самая высокая скорость выполнения стро- 
ковых операций достигается обычно при копировании одной строки в другую 
или при перемещении элементов строки из одной области памяти в другую. Это 
особенно заметно при перемещении больших объемов данных. 

Меньший выигрыш в производительности по сравнению с обычными коман- 
дами дают команды поиска и сканирования. На скорость выполнения строковых 
операций влияет и размерность операндов. Вот несколько полезных советов для 
работы с командами строковых примитивов: 


® При использовании цепочечных команд по\$, 510$, стр и баз в 16-разряд- 
ных приложениях не забывайте инициализировать регистры [$ и ЕЗ. 


» Устанавливайте флаг направления 02 в соответствии с направлением обра- 
ботки строк или массивов. 


®» Не забывайте устанавливать в регистрах ЕОТ (01) и ЕЗТ (51) необходимые 
значения. Например, команда тоузи предполагает использование операндов 
ОТ и 51, а команда стрза — Е5Ги ЕП]. 


» Инициализируйте регистр ЕСХ (СХ) в соответствии с количеством байтов 
или слов, участвующих в процессе обработки. 


» Для обычной обработки нужно использовать префикс гер (команды по\уз 
и 5605) и модифицированный префикс гере или герпе (команды стрз и $са5). 


» Помните об обратной последовательности байтов в сравниваемых словах 
при выполнении команд струм и зсази. 


® При обработке справа налево устанавливайте начальные адреса на последний 
байт обрабатываемой области. Если, например, строка 5ТЕ1\61 имеет длину 
16 байт, то для побайтовой обработки данных в этой области справа налево 
начальный адрес, загружаемый командой Теа, должен быть 5ТА1М1 + 15. 
Для обработки слов начальный адрес в этом случае равен ЗТВ1КЕ! + 14. 
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При использовании команды 10456 необходимо учитывать то, что на про- 
цессорах [л(е| Репйит эта команда работает медленнее, чем блок команд 


пюу АЕ. Буфе рёг [ЕЗГ 
11с  Е51 


Или такой блок: 


тоу АЕ. Буфе рег [ЕЗП] 
а94 ЕЗТ, 1 


То же самое касается и команд 1045м и 10454. Для повышения производи- 
тельности команду 1045, можно заменить блоком команд 


оу АХ. [$51] 
ааа $1. 2 


Аналогично, команду 10454 можно заменить таким блоком: 


тоу ЕАХ. [Е51] 
а94 ЕЗТ. 4 


При пересылке больших блоков байтов наиболее эффективно использова- 
ние команды гер тоузЬ. Для небольших блоков данных более эффективным 
является блок команд 


тоу АБ. Буе рёг ГЕЗГ] 
1ис ЕЗ| 
тоу Буфе рёг [ЕОТ]. АЁ 
1пс ЕБГ 


То же самое касается команд гер поузи и гер тоуза. В этом случае более 
высокую производительность при пересылке небольших блоков размером 
в слово обеспечивает следующий фрагмент программного кода: 


тоу АХ. мога рег [$1] 
а9а ЕЗТ, 2 

тоу мога рёг [ЕОТ]. АХ 
а4а ЕТ, 2 


А для двойных слов наиболее эффективен такой блок: 


тоу ЕАХ. [Е$Т] 
а44 ЕЗТ, 4 
моу [Е0Т]. ЕАХ 
ааа ЕОТ. 4 


Команда гер °сазБ на процессорах Ние! Репбит работает медленнее, чем 
следующий фрагмент программного кода: 


пех: 
тоу АЕ, Буфе рёг [ЕОТ] 
1пс ЕО! 
стр АГ. гедё 
]}е ех 
дес СХ 
дпг пех 
ех{: 
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Команду 5%056 можно эаменить комбинацией команд 

пом [01]. А: | — 

7йс 01 

А фраг мент программного кода для замены команды $$05м выг. Ълядит так: 
пом [01]. АХ 

ада 01. 2 

Наконец, команда $1054 может быть реализована следующим образом: 


том [Е0Г]. ЕАХ 
аа ЕОТ. 4 


Заканчивая рассмотрение материала, хотелось бы сделать некоторые обобще- 
ния относительно использования цепочечных команд. Наиболее производитель- 
ный код можно написать, если соблюдать несколько условий: 


данные в источнике и приемнике должны быть выровнены по 8-байтовой 
границе; 


флаг направления должен быть установлен в сторону увеличения адресов; 


счетчик в регистре ЕСХ должен иметь значение, большее или, по крайней 
мере, равное 64; 


разность между содержимым регистров ЕЗТ и Е01 должна быть больше или 
равна 32. 


При разработке высокоэффективного кода желательно все же избегать цепо- 
чечных команд, используя вместо них комбинацию поу/1тс или тоу/4ес. 


Арифметические 
и логические 
операции 





Данная глава посвящена арифметическим и логическим операциям, выполняе- 
мым центральным процессором. К группе арифметических операций можно от- 
нести: 


® сложение; 

® вычитание; 

® умножение; 

® деление; 

® логический и циклический сдвиг. 


Арифметические операции можно выполнять для беззнаковых и знаковых це- 
лочисленных данных. 

К логическим операциям можно отнести несколько команд, манипулирующих 
отдельными битами операндов. В группу логических команд входят команды ло- 
гического умножения (логическое И), логического сложения (логическое ИЛИ) 
и сложения по модулю 2 (исключающее ИЛИ). 

В этой главе приводятся как описания арифметических и логических команд, 
так и примеры их применения. Кроме того, здесь же рассматриваются операции 
преобразования между двоичными данными и АЗСП-кодами, которые играют 
существенную роль в математических вычислениях. 

Наш анализ начнем с логических команд процессора ие] Реп ит. 


8.1. Логические команды 


Первая команда, которую нам предстоит рассмотреть, — команда ап4. Эта ко- 
манда осуществляет логическое (поразрядное) умножение первого операнда на 
второй. Исходное значение операнда-приемника при этом теряется и замещается 
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результатом умножения. В качестве первого операнда команды апа можно указы- 
вать регистр, за исключением сегментного, или ячейку памяти. Вторым операн- 
дом может выступать регистр, за исключением сегментного, ячейка памяти ‘или 
непосредственное значение. При этом не допускается, чтобы оба операнда явля- 
лись ячейками памяти. Операнды могут быть байтами, словами или двойными 
словами. Результат выполнения команды воздействует на флаги $2, 2Ё и РЕ. 

Правила поразрядного умножения достаточно просты: если хотя бы один из 
попарно умножаемых битов является логическим нулем, то независимо от значе- 
ния второго бита результат будет нулевым. Результирующий бит равен 1 только 
в том случае, когда соответствующие биты обоих операндов равны 1. Далее при- 
водится простой пример, демонстрирующий логику работы операции логическо- 
го умножения. | 

В этом примере ор! и ор2 — 8-разрядные множители, а операнд ор12_вп4 — 
результат: 


0р1-—>010111008В 
апа 
0р2-›11011011В 


0р12_апд—>010110008В 


Следующий пример показывает реализацию операции логического И на языке 
ассемблера: 


тоу АХ. ОРРЕЙ 
ап АХ. ОИ ; после операции АХ = бЕй 


В этом примере в качестве одного из операндов используется ячейка памяти 


„Чата 
ор 4 ОАбОЗИ 
.соде 


поу АХ. 100ЕН 
ап АХ. ор ; после операции АХ = 21 


Еще один пример демонстрирует использование 32-разрядных операндов: 


тоу ЕОХ. 003А21А47И 
апа Ебх. 0080100ЕРИ : после операции ЕСХ = 3000047п 


Следующей командой, которая относится к группе логических команд и кото- 
рую мы рассмотрим, является команда ог (логическое ИЛИ). 

Команда ог выполняет операцию логического (поразрядного) сложения двух 
операндов. Результат замещает операнд-приемник, а операнд-источник не изме- 
няется. В качестве первого операнда может выступать регистр (за исключением 
сегментного) или ячейка памяти, вторым операндом может служить регистр 
(кроме сегментного), ячейка памяти или непосредственное значение. 

Не допускается определять оба операнда одновременно как ячейки памяти. 
Сам операнд может быть байтом, словом или двойным словом. Результат опе- 
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рации воздействует на флаги 02, 5Е, 2Е, РЕ и СЕ, при этом флаги СЕ и ОЕ всегда сбра- 
сываются в 0. 

Правила поразрядного сложения просты: если хотя бы один из попарно сла- 
гаемых битов является логической единицей, то независимо от значения второго 
бита результат равен единице. Результирующий бит равен 0 только в том случае, 
когда соответствующие биты обоих операндов равны 0. Далее приводится про- 
стой пример операции логического сложения. 

В этом примере ор! и ор2 — 8-разрядные слагаемые, а операнд ор12_ог — ре- 
зультат: 


0р1-›010111008В 
ог 
0р2-›11011011В 


0р12_ог-›11011111В 


Следующий пример показывает реализацию операции логического ИЛИ на 
языке ассемблера: 

тоу АХ. 000ЕП 

тои ВХ. ООЕ0П 

ог АХ, ВХ ; после операции АХ = ООЕЕИ, ВХ = 00РОЙ 

Как уже упоминалось, команда ог допускает задание непосредственного зна- 
чения в качестве второго операнда, что демонстрирует еще один пример: 

тоу АХ.001ЕИ 

ог АХ, 70А1И ; после операции: АХ = 70ВЕЙ 

Использование командой ог в качестве операнда ячейки памяти иллюстриру- 
ет следующий фрагмент программного кода: 

.даба 


мк ЧБ 97н 
.соде 


тоу СН. ОЕ1И 
ог СН. мк ; после операции: СН = 0Е7И 
Допускается использование 32-разрядных операндов, как видно из примера: 


„Чата 
ор Ча 820000398 
.соде 


ог ор. бАОН ; после операции: ор = 820000891 


К группе логических команд относится и команда хог (исключающее ИЛИ), 
выполняющая операцию логического (поразрядного) исключающего ИЛИ над 
двумя операндами. Результат операции перезаписывает первый операнд, а вто- 
рой операнд остается неизменным. Отдельные биты результата устанавливаются 
в 1, если соответствующие биты операндов различны, или в 0, если соответствую- 
щие биты операндов совпадают. 
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В качестве первого операнда команды хог допускается указывать регистр (за 
исключением сегментного) или ячейку памяти, в качестве второго — регистр 
(кроме сегментного), ячейку памяти или непосредственное значение, однако 
нельзя определять оба операнда как ячейки памяти. Операнды могут быть байта- 
ми, словами или двойными словами. Команда воздействует на флаги ОЕ, $Е, 22, РЕ 
и СЕ, причем флаги 0Е и СЕ всегда устанавливаются в 0, а состояние остальных 
флагов зависит от результата. 

Далее приводится простой пример, демонстрирующий логику работы опе- 
рации исключающего ИЛИ. В этом примере ор! и ор2 — 8-разрядные множители, 
а операнд 0р12_хог — результат: 


ор1-›010111008В 
хог 
0р2-›11011011В 


0р12_хог›10000111В 


Несколько примеров демонстрируют технику применения команды хог с раз- 
личными типами операндов. 

В качестве одного из операндов может использоваться непосредственное зна- 
чение: 


тоу АХ. ОЕСН 
хог АХ.ОЕ1ЕЕИ ; после операции АХ = 01131 


Команда хог может применяться для обнуления регистра: 
хог ЕОГ. ЕБГ ; обнуление ЕОХ 


Оба операнда команды могут быть регистрами. Следующий фрагмент про- 
граммного кода иллюстрирует этот случай: 
тоу АХ. 0О5ЕЕЙ 


том ВХ. ЗЕЙ 
хог АХ. ВХ : после операции АХ = 005С11. ВХ = ЗЕИ 


Для 32-разрядных операндов допустим такой фрагмент программного кода: 


тоу ЕАХ.0Е7З4Е1ААЙ 
хог ЕАХ.3100Сй : после операции ЕАХ = 05737ЕС76 


Отдельную группу команд, которую условно можно отнести к логическим ко- 
мандам, составляют команды сканирования битов. 


8.2. Команды сканирования битов 


Группа команд сканирования битов служит для анализа отдельных битов операн- 
да. Рассмотрим эти команды по порядку, начиная с команды 557. 

Команда 551 (ВЕ Зсал Еог\агА) сканирует слово или двойное слово в поисках 
бита, равного 1. Сканирование выполняется начиная с младшего бита по направ- 
лению к старшему. Если в операнде не обнаружены единичные биты, то устанав- 
ливается флаг 22Е. Если единичные биты есть, то номер первого из них заносится 
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в указанный в команде регистр. Номер бита — это его позиция в операнде, при- 
чем самый младший бит имеет номер 0. 

Первым операндом команды 657 должен быть регистр, в который помещается 
результат сканирования, вторым — регистр или ячейка памяти со сканируемым 
словом. Команда 65{ допускает использование как 16-разрядных, так и 32-разряд- 
ных операндов (но как первый, так и второй операнд должен быть одного типа). 

Примеры использования команды 651: 

тоу ВХ.70й : помещаем в регистр ВХ значение 00000000 011100008 

Ь$Т АХ. ВХ : после выполнения команды АХ = 4. 7Е =0 

тоу 0Х, 0 ; помещаем в регистр ОХ значение 0 

Ь$+ ВХ. 0Х :; ВХ остался без изменения. флаг 2Е = 1 


тоу ОХ. 8 —: в регистр ОХ помещается значение 00000000 000010008 
ЬЗР ВХ. 0Х ; после операции: ВХ = 3, 2 =0 


Чата 
ор Ом 4000и : ор = 01000000 000000008 
.соде 
ЬЗР АХ, эр: после операции АХ = О00ЕН (14). 7Р = 0 


Команда 55г (ВЕ Зсап Веуегзе) выполняет обратное сканирование битов слова 
или двойного слова в поисках бита, равного 1. Сканирование осуществляется по 
направлению от старшего бита к младшему. Если в операнде не обнаружены еди- 
ничные биты, то устанавливается флаг 27. Если единичные биты есть, то номер 
первого из них помещается в указанный в команде регистр. Номером бита счита- 
ется его позиция в слове, отсчитываемая от бита 0. Первым операндом команды 
55г нужно указывать регистр, в который помещается результат сканирования, вто- 
рым операндом может быть регистр или ячейка памяти со сканируемым словом. 
Команда 55г допускает использование 16-разрядных или 32-разрядных операн- 
дов, но оба операнда должны иметь один и тот же тип. Единственным исключе- 
нием является случай, когда в качестве второго операнда выступает константа. 

Рассмотрим несколько примеров использования команды 5г: 


тоу ВХ. 1701 :; в регистр ВХ помещаем 0000 0001 0111 00008 


Ь5г АХ. ВХ : после выполнения операции АХ = 8, 2Е = 0 
том 0Х. 0 : помещаем значение 0 в регистр ОХ 
Ьзг ВХ. 0Х : после операции ВХ - без изменения, 72 = 1 
тоу ОХ. 8 ; помещаем в ОХ значение 0000 0000 0000 10008 
ЬЗ ВХ. ОХ ; после операции ВХ = 3, 7Е = 1 
„дата 

ор @м 50001 ; ор = 0101 0000 0000 00008 
. соде 
Ь$г АХ, ор : после операции АХ = 000Ей (14). 2Е = 0 


Следующая команда, которую мы проанализируем, — команда 1 (ВЕ Тез). 
С ее помощью можно определить, установлен ли в заданном операнде определен- 
ный бит. Первым операндом команды является анализируемое значение, вторым — 
номер бита. В качестве первого операнда команды БЕ может выступать регистр 
или ячейка памяти, в качестве второго — регистр или непосредственное значение. 
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Команда допускает использование 16-разрядных или 32-разрядных операндов, 
но оба операнда должны иметь один и тот же тип. Исключением является случай, 
когда в роли второго операнда выступает константа. Полученное значение прове- 
ряемого бита становится значением флага СЕ. 

Рассмотрим несколько примеров использования команды В: 


тоу АХ. ООРЕИ —: помещаем значение 0000 0000 1111 11118 в регистр АХ 


ых. 7 ; после выполнения операции: бит 7 = 1, (Р=1 

тоу АХ. ООРРИ —:; помещаем значение 0000 0000 1111 11118 в регистр АХ 
Ы АХ. 8 : после выполнения операции: бит 8 = 0. СЕ = 0 

тоу АХ. 9007н :; помещаем значение 1001 0000 0000 01118 в регистр АХ 
тмоу ВХ. 12 : помещаем номер проверяемого бита в регистр ВХ 

Ы АХ. ВХ : после выполнения операции: бит 12 = 1, СЕ = 1 

„дата 

ор м 21 ; в переменной ор значение 0000 0000 0010 00018 
.соде 

Ь ор. 5 ; после выполнения операции: бит 5 = 1. СЕ = 1 


Команда Бс (В Тезё ми СотрНтепе) проверяет бит, указанный вторым 
операндом, в первом операнде, затем делает его значением флага СЕ и инвертиру- 
ет. Таким образом, номер бита выступает вторым операндом, а первым может 
служить регистр или ячейка памяти. Кроме того, можно указать номер бита 
или непосредственно, или через регистр. Команда допускает использование как 
16-разрядных, так и 32-разрядных операндов, но оба операнда должны быть од- 
ного типа. Исключением является случай, когда в качестве второго операнда вы- 
ступает константа. 

Рассмотрим примеры применения команды с: 


оу АХ. 0076 ; в регистр АХ помещаем значение 0000 0000 0111 11008 


Ыс АХ. 5 : после операции АХ = 00561. СЕ = 1. бит 5 инвертирован в 0 
тоу АХ. 00ЕЕИ :; в регистр АХ помещаем значение 0000 0000 1111 11118 
Ыс АХ. 8 ; после операции АХ = 01ЕЕй, СР = 0, бит 8 инвертирован в 1 
тоу АХ. 0Е001и :; в регистр АХ помещаем значение 1110 0000 0000 00018 
тоу ВХ. 14 : в регистр ВХ -> номер проверяемого бита 
Ыс АХ.ВХ ; после операции АХ = 0А00]И. СЕ=1, бит 14 инвертирован в 0 
.дафа 

ор м 0А7И :; в переменной ор значение 1010 11118 
.соде 
с ор. 5 ; после операции ор = 871, СЕ = 1. бит 5 инвертирован в 0 


8.3. Команды сдвига и циклического сдвига 


Команды сдвига и циклического сдвига предоставляют целый ряд возможностей 
по манипулированию данными байта, слова и двойного слова. Эти команды про- 
изводят перемещение битов в операндах влево или вправо, причем сдвиг может 
быть как логическим (знак операнда не учитывается), так и арифметическим 
(для знаковых операндов). 
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Все команды сдвига и циклического сдвига используют флаги переноса СЕ и пе- 
реполнения ОЕ. При выполнении команд сдвига флаг СЕ всегда содержит значение 
последнего выдвинутого бита: 


® 5Пг — логический (беззнаковый) сдвиг вправо; 

® 51 — логический (беззнаковый) сдвиг влево; 

® 5Н14 — логический сдвиг двойного слова влево; 
® Пг — логический сдвиг двойного слова вправо; 
® 5а| — арифметический сдвиг влево; 

® саг — арифметический сдвиг вправо. 


Циклический сдвиг представляет собой операцию сдвига, при которой выдви- 
нутый бит занимает освободившийся разряд: 


® гог — циклический сдвиг вправо, 

® го — циклический сдвиг влево; 

® гсг — циклический сдвиг вправо с переносом; 
® гс — циклический сдвиг влево с переносом. 


Вначале проанализируем, как работают команды сдвига. В следующем фраг- 
менте показано использование команды $Нг: 


оу (.. 03 ; счетчик количества сдвигов -> СЁ 
тоу ВЁ. 101101118 ; 100 В -> В 

иг В. 1 : после операции ВЁ = 010110118 
иг В.С ; после операции В = 000010118 


Первая команда 5Вг сдвигает содержимое регистра ВЕ вправо на 1 бит. Выдви- 
нутый в результате бит становится значением флага СЕ, а самый левый бит реги- 
стра ВЕ заполняется нулем. Вторая команда сдвигает содержимое регистра ВЕ еще 
на три бита. При этом флаг СЕ последовательно принимает значения 1, 1, 0, автри 
левых бита в регистре ВЕ заносятся нули. 

Посмотрим, как выполняется команда арифметического сдвига вправо заг: 


тоу (1, 03 : счетчик количества сдвигов -> (1 
тои АЕ, 101101118 ; 101101118 -> А 

заг А. 1 : после операции АЁ = 110110118 
заг А. (1 ; после операции АЁ = 111110118 


Команда заг отличается от команды $Пг тем, что для заполнения левого бита 
используется знаковый бит. Таким образом, положительные и отрицательные ве- 
личины сохраняют свой знак. В приведенном примере знаковый бит содержит 
единицу. 

При сдвигах влево правые биты заполняются нулями, поэтому команды сдви- 
га $Н1 и 5а1 дают одинаковый результат. 

Сдвиг влево часто используется для умножения числа на степень двойки, а сдвиг 
вправо — для деления на степень двойки. Такие операции выполняются значи- 
тельно быстрее, чем обычные команды умножения или деления. При делении попо- 
лам нечетных чисел результатом становятся значения, округленные в меньшую 
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сторону. Например, деление чисел 5 или 7 на 2 дает результат 2 и 3 соответственно, 
и, кроме этого, флаг СЕ устанавливается в 1. Более того, при ‘выполнении, напри- 
мер, сдвига на 2 бита более эффективным является использование двух команд 
сдвига, а не одной команды с предварительной загрузкой регистра С( значением 2. 
Для проверки бита переноса (флага (СР) по окончании операции можно выпол- 
нить команду {с. 

Перейдем к анализу команд циклического сдвига. Общей особенностью таких 
команд является то, что самые старшие (младшие) сдвигаемые биты переходят в са- 
мые младшие (старшие) позиции одного и того же операнда. Этим команды цик- 
лического сдвига отличаются от команд обычного сдвига, в которых выдвигае- 
мые из операнда биты теряются. В циклическом сдвиге может быть задействован 
и флаг переноса СЕ, при этом выдвигаемый бит помещается в (Е, а предыдущее 
значение флага переноса помещается в самый старший (младший) бит операнда. 

Следующий фрагмент программного кода иллюстрирует операцию цикличе- 
ского сдвига гог: 


тоу СЕ.2И ‚ счетчик сдвигов -> (4 
тоу АЁ.100111018 —:; число 100111018 -> А 
гог А. : после операции А = 110011108 
гог А... ; после операции АЕ = 101100118 


Первая команда гог при выполнении циклического сдвига перемещает правый 
единичный бит регистра АЁ в освободившуюся левую позицию. Вторая команда 
гог переносит, таким образом, два правых бита. 

В командах гсг и гс] в сдвиге участвует флаг СЁ. Выдвигаемый из регистра бит 
заносится в флаг СЕ, а значение (Е при этом поступает в освободившуюся позицию. 

Далее приведен пример использования команды гс1: 


тоу (1.2И : счетчик сдвигов -> (1 
поу АЁ..110111018 : число 110111018 -> А. 
гс] А... 1 : после операции АЁ = 110011108 
гс1 АС, СЕ ; после операции А = 101100118 


Рассмотрим пример, в котором используются команды циклического и про- 
стого сдвигов. Предположим, что 32-разрядное значение находится в регист- 
рах ОХ: АХ, так что левые 16 бит располагаются в регистре 0Х, а правые — в АХ. Для 
умножения на 2 этого значения допустимы две следующие команды: 


$1 АХ.1 ; Умножение пары регистров 
гс1 0Х.1 : ОХ:АХ на 2 


Здесь команда $11 сдвигает все биты регистра АХ влево, причем самый левый 
бит становится значением флага СЕ. Затем команда гс] сдвигает все биты регистра 
ОХ влево, и в освободившийся правый бит заносит значение из флага СЕ. 


8.4. Обработка целых чисел 


Вначале кратко рассмотрим некоторые теоретические аспекты обработки число- 
вых данных. Процессор 1п(е! РепНит имеет команды для обработки целочислен- 
ных арифметических данных двух форматов: двоичного и двоично-десятичного 
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{ВСО). Данные в двоичном формате могут интерпретироваться как числа со зна- 
ком или без знака, при этом не существует отдельных форматов для представле- 
ния знаковых и беззнаковых чисел. Одно и то же двоичное представление может 
рассматриваться и как значение со знаком, и как значение без знака в зависимо- 
сти от того, как трактуется старший бит операнда. Для чисел без знака он является 
старшим значащим битом операнда. В то же время для чисел со знаком нулевое 
значение соответствует положительному значению, а единичное — отрицатель- 
ному числу. Остальные разряды операнда — значащие. 

Следует заметить, что значащие разряды не всегда представляют абсолютное 
значение (модуль) числа. Это верно только для положительных чисел, а для от- 
рицательного числа они представляют так называемый дополнительный код числа. 

Двоично-десятичные числа, в свою очередь, могут быть представлены в одном 
из следующих форматов: 


® в формате АЗСП; 
® неупакованном двоично-десятичном формате; 
® упакованном двоично-десятичном формате. 


Рассмотрим эти форматы более подробно. Представление чисел в формате 
АЗСП удобно в тех случаях, когда необходимо выполнять ввод чисел с консоли 
или вывод на какое-либо устройство, например дисплей или принтер. Для получе- 
ния правильного результата при выполнении арифметических операций с таки- 
ми числами необходимо проводить корректировку результата с помощью специ- 
альных команд. Операции с числами в формате АЗСИ будут рассмотрены более 
подробно далее. АЗСП-числа представлены следующим образом: старший (левый) 
полубайт каждого байта содержит значение 3Ь, а младший (правый) полубайт — 
значение десятичного разряда. 

Например, число 6591 в формате АЗСП представлено как 36353931, при этом 
самый старший байт содержит значение 361, а самый младший — 311. 

Числа в неупакованном двоично-десятичном формате отличаются от их АЗСП- 
представления тем, что левые полубайты таких чисел установлены в 0. Это зна- 
чительно облегчает выполнение операций умножения и деления над такими чис- 
лами. Например, число 6591 в неупакованном формате выглядит как 06050901, 
причем самый старший байт содержит число ОбТ, а самый младший — 016. 

Следует заметить, что операции над неупакованными двоично-десятичными 
числами выполняются медленнее, чем над двоичными. Это связано с тем, что не- 
упакованные числа обрабатываются байт за байтом. Преимуществом неупакован- 
ных чисел является то, что с их помощью можно легко организовать программ- 
ную обработку больших чисел. 

Последний формат представления чисел из списка — упакованный двоично-де- 
сятичный формат. Каждый байт упакованного числа содержит две десятичные 
цифры, то есть каждое десятичное число представлено четырьмя битами. Напри- 
мер, число 6591 в упакованном формате будет представлено как 6591, причем 
старший байт содержит значение 656, а младший — 916. Упакованные двоичные 
числа можно только складывать и вычитать, другие операции требуют дополни- 
тельного преобразоваиия в неупакованный формат. В настоящее время упакован- 
ные двоично-десятичные числа находят ограниченное применение. 
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Остановимся на особенностях манипуляций знаковыми и беззнаковыми чис- 
лами. Аппаратная интерпретация процессором старшего бита операнда реализо- 
вана в командах 111 и 141%. Команды а44 и зи не делают разницы между знако- 
выми и беззнаковыми величинами, они просто складывают и вычитают биты, 
поэтому в этих случаях забота о правильной трактовке старшего бита ложится на 
программное обеспечение. Хочу особо подчеркнуть, что процессор ничего не 
предполагает относительно. знака числа и выполняет вычисления двоичных зна- 
чений. При этом фиксируется ситуация выхода за пределы разрядной сетки опе- 
ранда (флаг СР) и состояние старшего разряда (флаг 0Е). 

Еще одной особенностью, которую следует учитывать при выполнении ариф- 
метических операций, является переполнение. Причина этого — ограниченность 
разрядной сетки операндов. При выполнении операции сложения или умноже- 
ния возможен выход результата за пределы разрядной сетки. Если результат 
больше максимально представимого значения для операнда данной размерности, 
то говорят о ситуации переполнения. Иначе, если результат меньше минимально 
представимого числа, то говорят о ситуации антипереполнения. 

Рассмотрим более подробно операции над целыми числами и начнем с опера- 
ций сложения и вычитания. 

Команды аб и $\6 выполняют сложение и вычитание байтов или слов, содер- 
жащих двоичные данные. Вычитание выполняется в компьютере по методу сло- 
жения с двоичным дополнением: для второго операнда устанавливаются обрат- 
ные значения битов и прибавляется 1, затем выполияется операция сложения 
с первым операндом. Во всем, кроме первого шага, операции сложения и вычита- 
ния идентичны. | 

В зависимости от размера и типа операндов, участвующих в операциях сложе- 
ния и вычитания, возможны следующие ситуации: 


® сложение/вычитание регистр-регистр; 

® сложение/вычитание память-регистр; 

® сложение/вычитание регистр-память; 

® сложение/вычитание регистр-непосредственное значение; 
® сложение/вычитание память-непосредственное значение. 


При выполнении операций сложения/вычитания, как и для других арифмети- 
ческих операций, для получения правильного результата необходимо контро- 
лировать состояние некоторых флагов процессора. Это касается флагов СР и ОЕ. 
С помощью этих флагов программа должна учитывать возможное переполнение 
результата и перенос в старшие разряды. Для этого отслеживаются условия, зада- 
ваемые флагами, и выполняются действия: 


® (Е =оОЕ-= 0 — результат правильный и является положительным числом; 
® (Е= 1, 0Е = 0 — результат правильный и является отрицательным числом; 


® (РОГ = | — результат неправильный и является положительным числом, 
хотя правильный результат должен быть отрицательным (для корректи- 
ровки необходимо увеличить размер результата в два раза и заполнить это 
расширение нулевым значением); 
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® СЕ-0, ОЕ = 1 — результат неправильный и является отрицательным числом, 
хотя правильный результат должен быть положительным (для корректи- 
ровки необходимо увеличить размер результата в два раза и произвести 
расширение знака). 


Выполнение арифметических операций иногда может приводить к ситуации 
переполнения. Рассмотрим, например, операцию сложения для знаковых операн- 
дов размерностью в 1 байт. Один байт содержит знаковый бит и 7 бит данных, то 
есть диапазон допустимых значений находится между —128 и +127. Не исключе- 
на возможность, что результат арифметической операции может легко превзойти 
емкость однобайтового регистра. 

Необходимо учитывать и то, что результат сложения в регистре А|, превы- 
шающий его емкость, автоматически не переходит в регистр АН. Предположим, 
что регистр АЁ содержит 601, тогда после выполнения следующей команды в А| 
будет находиться значение 801: 


849 АС. 208 


Кроме того, устанавливаются флаг переполнения и знаковый флаг. Причи- 
на заключается в том, что шестнадцатеричное значение 80 (двоичное 10 000 000) 
является отрицательным числом. Таким образом, вместо +128 мы получаем —128. 
Очевидно, что размерность регистра А! недостаточна для такой операции, поэто- 
му можно использовать регистр АХ. Увеличить размерность операнда можно с по- 
мощью команды сБм (Сопуеге Вуе о \Мог4 — преобразовать байт в слово). 

В следующем примере значение 601 в регистре АЕ преобразуется в шестнад- 
цатеричное значение 60 в регистре АХ. Знаковый бит передается в регистре АН. 
В этом случае команда а44 дает правильный результат и в регистре АХ будет нахо- 
диться значение, равное шестнадцатеричному значению 0080 или в десятичной 
нотации +128: 

СБм ; расширить АЁ до АХ 

а99 АХ. 20Н ; прибавить 20Н к АХ 

Следует заметить, что полное 16-разрядное слово имеет также ограничение: 
один знаковый бит и 15 бит данных, что соответствует значениям от —32 768 до 
+32 767. 

Лучше всего анализировать эти операции на практических примерах. В пер- 
вом примере выполняется сложение двоичных чисел размером в 1 байт без уче- 
та знака. Программный код реализован в виде процедуры а94Ь_ип$19пе4 и показан 
в листинге 8.1, 

В этом примере результат сложения сохраняется в переменной 5ит, а возмож- 
ное переполнение из-за недостаточной размерности операндов фиксируется в пе- 
ременной саггу. Таким образом, программа учитывает возможное переполнение 
результата. Например, если ор1 содержит значение 140, а ор2 — 119, то после сло- 
жения в переменной $ит будет содержаться значение 3, а переменная саггу полу- 
чит значение 1. Это легко объяснимо, поскольку произошло переполнение реги- 
стра А- — результат превысил значение 256. 
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Листинг 8.1. Сложение однобайтовых чисел без знака 


„ааа 


0р1 Ч ? : первый операнд 
орг Ч ? : второй операнд 
саггу 40 : здесь запоминается флаг переноса 
$ит 950 ; здесь хранится результат сложения 
.соде 
а99_ип$19пед ргос. 
с1с : очистка флага переноса перед сложением 
оу АЕ. ор1 
244 А.. орг 
дис ехи ; проверка на переполнение 
а44 саггу.1 ; сохраняем флаг переноса 
ех1т: 
ту $мп. А 
гес 


ада _ип$19пеф епар 


При вычитании однобайтовых чисел вместо команды ада применяется коман- 
да зи6. Кроме того, операция вычитания может дать отрицательное число, и это 
необходимо учитывать для правильной интерпретации результата. В следующем 
примере выполняется вычитание двоичных чисел размером в 1 байт. Программ- 
ный код реализован в виде процедуры зи6_Буте$ (листинг 8.2). 


Листинг 8.2. Вычитание однобайтовых чисел 


Фата 


0р1 46 ? ; первый операнд 
орг 96 ? : второй операнд 
саггу 9460 : здесь запоминается флаг переноса 
зи гасе 40 : здесь хранится результат вычитания 
‚соде 
$иб_Буфе$ ргос 
С1с : очистка флага переноса перед сложением 
оу АЕ. 0р1 
$и6 АЁ. орё 
дис ех\ ; проверка на переполнение 
а49 саггу.1 : сохраняем флаг переноса 
ех\: 
оу зибзфгась. АЁ 
ге 


$иб_Буфе$ епар 


По сравнению с предыдущим примером здесь все команды сложения замене- 
ны аналогичными командами вычитания. Для значений ор] и орд, равных, напри- 
мер, 119 и 140 соответственно, после операции вычитания переменная зи гасе 
будет содержать шестнадцатеричное значение ЕВ. Это значение можно рассмат- 
ривать и как беззнаковое число 235, и как отрицательное -21. По смыслу задачи 
разность ор] и ор2 должна быть равной -—21. Из этого примера видно, что ин- 
терпретация результата арифметической операции возлагается на программиста. 

Хочу сделать важное замечание. Поскольку результат выполнения операции — 
отрицательное число, дополнительно устанавливается флаг знака 5. Этот флаг 
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можно использовать для анализа результата арифметической операции в процес- 
се разработки программного кода. 

Вернемся к первому примеру (см. листинг 8.1). Видно, что сохраненное в пе- 
ременной зип значение равно 3, в то время как правильный результат должен 
быть 259. Для того чтобы получить реальное значение $ит, необходимо сделать 
некоторые изменения в программе. Модифицированный вариант программы по- 
казан в листинг 8.3. 


Листинг 8.3. Модифицированный вариант сложения однобайтовых чисел 


.Чафа 
0р1 08 140 
орг ОВ 119 
зип 00 
.соде 
ад4Ь ип$19пеб ргос 
хог АХ. АХ 
сс 
тоу АЕ. 0р1 
а4с АЁ. орг 
упс ехи 
а4с АН. 0 
ех1*: 
оу ит. АХ 
ада ип$19пед епар 


Проанализируем внесенные изменения. Во-первых, переменная зип имеет те- 
перь разрядность слова, что позволяет расширить диапазон сохраняемых значе- 
ний до 65 536. Во-вторых, при возникновении переноса он учитывается в стар- 
шем байте регистра АХ (команда абс ай, 0). Наконец, сам результат имеет разряд- 
ность 16 бит, что в данном случае дает правильный результат — переменная 5ит 
будет содержать значение 259. 

Сложение двоичных чисел большей размерности (2—4 байта) выполняется 
аналогично. Для этого необходимо заменить директиву ОВ на 0/00 и регистр АЕ 
на АХ/ЕАХ. Следующий пример демонстрирует это (листинг 8.4). 


Листинг 8.4. Сложение двух чисел размером в слово 


„дата 
0р1 Чи 1407 —: первый операнд 
ор2 би 9119 —; второй операнд 
саггу 40 : здесь запоминается флаг переноса 
$ит Ч 0 : здесь хранится результат сложения 
.с0де 
ад» ипз19пед ргос 
сс : очистка флага переноса перед сложением 
тоу АХ. 0р1 
244 АХ. орг 
дис ехе ; проверка на переполнение 
а49 саггу.1 : сохраняем флаг переноса 
ех1*: 
тоу $ит. АХ 
ге 
а09и ип$1дпед епдр 
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Результатом сложения двух слов, ор1 и орд, является число 10 526. Операцию 
сложения двух слов выполняет процедура а@ди: ипз1дпед. В большинстве совре- 
менных программных продуктов приходится иметь дело с большими числами, 
представленными несколькими байтами. Например, для сложения многобайтовых 
чисел без знака требуется более сложный алгоритм, чем для байтов или слов. Чтобы 
понять принцип нахождения суммы многобайтовых чисел без знака, рассмотрим 
пример сложения двухбайтовых чисел и расширим наш алгоритм для случая 
произвольного числа байтов. Следующая процедура (назовем ее а44 | ПиТАБуе$) 
складывает два двухбайтовых. числа (листинг 8.5). 


Листинг 8.5. Сложение двух двухбайтовых чисел 


.Чата 

0р1 ПМ 3501 
ор? ПИ 781 
зим 00 

.соде 

899 ти1е1Бусе$ ргос 
сс 
хог АХ. АХ 
моу АЕ. Бубе рег ор1 
244 АЕ. Буфе рёг орё 
оу Бубе рёг 5ит. А 
тоу АЕ. Буфе рег ор1+1 
а4с АЕ. Буфе рёг ор2+1 
тоу Буфе рёг 5итн1, АЁ 
геё 

а94 пи1е1Бусе$ епар 


Нахождение суммы операндов ор] и орё выполняется по такой схеме: вначале 
находим сумму младших байтов этих операндов и заносим ее в младший байт пе- 
ременной зим, которая будет содержать результат сложения. После этого находим 
сумму старших байтов переменных ор1 и ор2 и помещаем ее в старший байт пе- 
ременной зим, при этом учитывается флаг переноса (вместо команды аб4 при- 
меняется адс). Следует заметить, что размерность операндов ор] и ор2 должна 
быть одинаковой. Изменим программный код процедуры а49 ти 1Бу(е$ (см. ли- 
стинг 8.5) так, как показано в листинге 8.6. 


Листинг 8.6. Сложение двухбайтовых чисел (улучшенная версия) 


.дата 
0р1 Ви 11901 
Теп ЕДУ $-0р1 
орё Ом 5598 
зип 0 
.соде 
а49 ти11Бусе$ ргос 
с1с 
хог АХ. АХ 
моу СХ. 1еп 
]Леа 51, Буе рёг ор1 
1еа ОГ. Буе рёг ор2 
Леа ВХ. Бу{е рег $ит 
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пехе_Буте: 
оу А, [$1] 
ас А. [01] 
оу Буе ре" [ВХ]. А 
ис 51| 
1ис 01 
1пс ВХ 
Тоор пехё_Бубе 
ге 
809 ти11Бусе$ епар 


Модифицированная процедура работает точно так же, как исходная, основное 
различие в том, что вычисление частичных сумм одннаковых байтов выполняет- 
ся в цикле. При этом в счетчике СХ содержится размер операндов в байтах. Эту 
процедуру можно использовать для суммирования большего числа байтов, если 
изменить значение в счетчике СХ. Для заданных значений операндов ор] и орё ре- 
зультат равен 17 499. 

Вычитание многобайтовых чисел проводится по такой же схеме, с той лишь 
разницей, что команды сложения заменены командами вычитания. В листин- 
ге 8.7 показан пример побайтового вычитания двух слов с помощью процедуры 
$иб_ми 1 1Буте$. 


Листинг 8.7. Вычитание двухбайтовых чисел 


.дака 


0р1 и 1901 
Теп ЕСИ $-ор1 
орг И 5598 
зиб$&гасё би 0 
‚соде 
сиб пи 1Буфе$ ргос 
сс 
хог АХ. АХ 
моу СХ. 1еп 


1еа 51. Буе ри` ор1 
1еа ОТ. Бубе рег орг 
1еа ВХ. Буфе рег зибзфгасе 
пехё_Буте: 
моу АБ. [51] 
$6 А. [00 
оу Буе рёг [ВХ]. АЁ 
1тс $1 
11с 01 
1йс ВХ 
1Тоор пехё_Буфе 
ге 
$и6_ми11Бусе$ епар 


Для данных значений операндов результат вычитания равен 3697. 

Сложение/вычитание многобайтовых чисел по байтам или по словам позво- 
ляет выполнять арифметические операции над числами произвольной большой 
размерности (естественно, что диапазон таких чисел определяется архитектурой 
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компьютера). Приведу пример законченной процедуры на ассемблере, позво- 
ляющей находить сумму восьмибайтовых целых чисел. Процедура называется 
_а99 ВБу+е$, и ее исходный текст представлен в листинге 8.8. 


Листинг 8.8. Сложение 8-байтовых чисел (32-разрядная версия) 


.686 

„тоде] Р]а* 

орёТоп сазетар:попе 

„Чата 
0р1 00 15751 
1еп  ЕОУ $-ор1 
орё 00 91839 


$ит 00 
.соде 
_а99 8Бусе$ ргос 
ризН ЕВХ 
сс 
хог ЕАХ, ЕАХ 
тоу ЕСХ, Теп 


]Леа ЕЗГ. Буёе рег ор1 
Теа ЕОГ. Буёе рег орё 
Теа ЕВХ. Буёе ри^ $ит 
пехё_Бубе: 
тоу АЁ. [ЕП] 
а4с АБ. [ЕОГ] 
тоу Бубе рёг [ЕВХ]. АЁ 
116 ЕЗ| 
1пс ЕБ] 
1пс ЕВХ 
]Тоор пехё_Бубе 
Теа ЕАХ, зим 
рор ЕВХ 
ге 
_а49 ВБуке$ епар 
епд 


В основе работы алгоритма побайтового сложения лежит попарное сложе- 
ние байтов, находящихся на одинаковых позициях в операндах-слагаемых. При 
этом необходимо учитывать флаг переноса, который может устанавливаться 
после сложения байтов. Хочу напомнить, что оба операнда должны иметь одина- 
ковую размерность. 

Ввиду наличия цикла используется только одна команда сложения а4с. Перед 
выполнением цикла команда с1с устанавливает нулевое значение флага переноса 
СЕ. Для того чтобы подобный алгоритм работал, необходимо обеспечить смеж- 
ность слов, выполняя обработку справа налево. Кроме того, дополнительно уста- 
новите счетчик байтов в регистре ЕСХ. 

Результатом выполнения программного кода при данных значениях операн- 
дов является число 107 590, помещенное в переменную им. Эту процедуру можно 
использовать при разработке программы на одном из языков высокого уровня. 
Наиболее удобный способ сделать это — поместить 32-разрядный адрес перемен- 
ной зип в регистр ЕАХ и вернуть управление основной программе. 
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Например, программный код консольного 32-разрядного приложения в \151а] 
С++ МЕТ может выглядеть так, как показано в листинге 8.9. 


Листинг 8.9. Демонстрационная программа для процедуры из листинга 8.8 


ЗАпсТиде <${910.1> 
ехсегп "С" ип$19пед 1пё* а99 8Буе$ (014): 
11 ма1п(у014) 


{ 
ип$197ед 1п&* 11 = а494_ВБуке$ 0); 
рг1ие + ("Вези1е ог а941пд 8 Бубе$ = %и\п", *11): 
детспаг(): 
гефигп 0: 


} 


Во всех рассмотренных примерах размерность операндов, вовлеченных в опе- 
рации сложения/вычитания, была одинаковой. Но что делать, если размеры 
операндов различны? Если операнды, участвующие в операции, предполагаются 
беззнаковыми, то проблему можно решить довольно просто: сформировать из 
данного операнда новый, повышенной размерности, за счет заполнения старших 
байтов сформированного операнда нулями. Например, если необходимо увели- 
чить размерность беззнакового числа на 1 байт, то можно сформировать из него 
слово и заполнить старший байт нулями, оставив при этом младший байт без из- 
менения. Проиллюстрировать вышесказанное можно на примере: 


„Чата 
ор_Буе 08 5 
ор мога Ом 0 
.с0де 


тоу АЁ. ор_Бубе 
тоу Бубе рёг ор_мог4. АЁ 


После выполнения этого фрагмента программного кода переменная ор_мог4, 
имеющая размерность слова, в старшем байте будет содержать нули, а в млад- 
шем — значение 5. 

Если необходимо преобразовать знаковое число, требуется более сложная про- 
цедура. Для решения подобных задач в процессор П{е] Репиит включен ряд спе- 
циальных команд, облегчающих процесс преобразования: 


®_ сБм (Сопуегё Вуе ю У/ога — преобразование байта в слово) — команда за- 
полняет регистр АН знаковым битом числа, находящегося в регистре А|, что 
дает возможность выполнять арифметические операции над исходным 
операндом-байтом, как над словом в регистре АХ. Команда не имеет пара- 
метров и не воздействует на флаги процессора; 


® сд (Сопуеге У/огА зо РоцЫе — преобразование слова в двойное слово) -—- 
команда преобразует слово в регистре АХ в двойное слово в регистрах 
ОХ: АХ, при этом старший бит в регистре АХ распространяется на все биты 
регистра 0Х; 
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сад (Сопуегё ДоцЫе У/ог4 +0 Опакег У/ог — преобразование двойного 
слова в учетверенное) — двойное слово, находящееся в регистре ЕАХ, преоб- 
разуется в учетверенное слово в регистрах ЕОХ:ЕАХ, при этом старший бит 
регистра ЕАХ распространяется на все биты регистра ЕБХ. 


Команда с94 расширяет знак двойного слова в регистре ЕАХ на регистр Е0Х. Эту 
команду можно использовать для образования четырехсловного делимого из 
двухсловного перед операцией двухсловного деления. Команда не имеет пара- 
метров и не воздействует на флаги процессора. 

Для демонстрации работы команд преобразования типов рассмотрим пример, 
в котором вычитаются многобайтовые числа разного размера. Сама операция 
реализуется в процедуре _зи6_ВБу{е$ (листинг 8.10). 


Листинг 8.10. Вычитание многобайтовых чисел разного размера (32-разрядная версия) 


.686 
„тюде] 11аё 
ор\оп сазетар:попе 
‚ Часа 
0р1 00 15751 
Теп ЕСИ $-ор1 
орг_94 06 97106 
ор2 0 
зирзсгасе 90 
.соде 
_зи6_ВБубез ргос 
ризн ЕВХ 
тоу ЕСХ. 1еп 
тоу ЕАХ, орё_99 ; здесь выполняется преобразование двойного 
; слова ор2_99 в учетверенное слово в орё 
; С помощью команды с99 
с94 


оу Фиог@ рег ор2. ЕАХ 
тоу Фиога рёг ор2+4, ЕБХ 


хог 
с1с 
Теа 
Теа 
Теа 


ЕАХ. ЕАХ 


ЕЗТ. Буфе рг ор1 
ЕОГ. Бузе рег орг 
ЕВХ. Буфе рёг зибзгасе 


пех _Буке: 


оу 
$6 
оу 
тис 
Тис 
Тис 


АЕ. [Е$13 

АЕ. [ЕО 

Буфе рёг [ЕВХ]. А 
Е 

ЕО 

ЕВХ 


1оор пехё_Буфе 


Теа 


рор 
ге 


ЕАХ. зибзгасе 
ЕВХ 


_$и6_ВБуфез епар 


епд 
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Процедура _5и6_8Бубе$ посредством регистра ЕАХ возвращает адрес переменной 
$и6$фгас®, содержащей результат вычитания. 

Операция умножения для беззнаковых данных выполняется с помощью коман- 
ды пи], а для знаковых — 1ти1 (П(ерег Миар|саноп — умножение целых чисел). 
Формат обрабатываемых чисел и выбор подходящей команды умножения опреде- 
ляет сам программист. Существует несколько форматов для команд умножения: 


® Множимое находится в регистре А|., а множитель — в ячейке памяти разме- 
ром в 1 байт или в однобайтовом регистре. После умножения результат по- 
мещается в регистр АХ. Операция перезаписывает данные в регистре АН. 


® Множимое находится в регистре АХ, а множитель — в однословной ячей- 
ке памяти или в регистре. Произведение представляет собой двойное сло- 
во, старшая часть которого размещается в регистре 0х, а младшая — в реги- 
стре АХ. Операция перезаписывает данные, которые до этого находились 
в регистре 0Х. 


® Множимое находится в регистре ЕАХ, а множитель — в двухсловной ячейке 
памяти или в регистре. Произведение представляет собой два двойных сло- 
ва, при этом старшее слово размещается в регистре Е0Х, а младшес — в реги- 
стре ЕАХ. Операция перезаписывает данные, которые до этого находились 
в регистре Е0Х. 


Команды пи] и ти] имеют единственный операнд, являющийся множителем. 
Проанализируем следующую команду: 


ми орг 


Здесь множителем является переменная орг. Если переменная орг определена 
как байт, то операция предполагает умножение содержимого А на значение байта 
в переменной орг. Если переменная определена как слово, то операция предпола- 
гает умножение содержимого АХ на значение слова, содержащегося в орг. Нако- 
нец, если переменная орг определена как двойное слово, то операция предполага- 
ет умножение содержимого ЕАХ на значение двойного слова в переменной орг. 

Если множитель находится в регистре, то размерность регистра определяет 
тип операции, например: 


ПИТ СЕ 


Поскольку регистр С! содержит один байт, то в качестве множимого будет вы- 
бран регистр А, а произведение помещается в регистр АХ. Если выполняется сле- 
дующая команда, то множитель в регистре ВХ имеет размерность слова, поэтому 
в качестве множимого выбирается регистр АХ, при этом произведение помещается 
в пару регистров 0Х:АХ: 


пи ВХ 


После выполнения команд пи] и 1/1 флаги СЕ и 0Е устанавливаются в том слу- 
чае, если старший байт результата содержит значение, например: 
моу АЕ. 37 


моу В, 5 
Ты ВЕ 
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После выполнения операции умножения регистр АХ содержит 00В9Н (+185), 
при этом СЕ = 1 и ОЕ = 1. Регистр АН содержит значение (в данном случае — все 
нули). Рассмотрим другой пример: 

оу АЕ. -37 


шоу ВЕ. 5 
11 ВЕ 


После выполнения операции умножения регистр АХ содержит 0ЕЕ47В (-185). 
Поскольку в регистре АН содержится расширение знака регистра А. (ОЕРБ), то 
флаги имеют следующие значения: СЕ = 0, ОЕ = 0. 

При выполнении операций умножения и деления (впрочем, это касается так- 
же и сложения/вычитания) нужно по возможности выбирать большую разряд- 
ность операндов. Во многих случаях это позволяет избежать ситуаций перепол- 
нения и вызываемых такими ситуациями ошибок. 

Рассмотрим практические примеры использования команд ти] и 1ти1. Вначале 
проанализируем операции беззнакового умножения. Наш следующий пример 
состоит из двух процедур — _ми|_мог4$ и _пи1_п1хед. С помощью процедуры 
_Ми1_мога$ выполняется умножение двух операндов, ор1_мога и ор2_мога, имеющих 
размерность слова, а результат помещается в переменную 0р1_ти1_ор2 размерно- 
стью в двойное слово. Процедура возвращает в качестве результата адрес пере- 
менной ор1_ти1_орё в регистре ЕАХ. 

Процедура _ти1_п1хед выполняет умножение операнда ор_Буфе размерностью 
в 1 байт на ор_мога, имеющий размерность слова, и результат помещается в двух- 
словную переменную ор2_пти1_пхед. Процедура возвращает в качестве результата 
адрес переменной ор_пти1_п1хей в регистре ЕАХ. Программный код процедур пред- 
ставлен в листинге 8.11. 


Листинг 8.11. Умножение чисел разной размерности (32-разрядная версия) 


. 686 
„моде? Раф 
орёТоп сазетар: попе 
„Чата 
ор1_мога 0М 37 
ор2_мога 0М 24 
ор1_ми1_орг 000 
ор_Буе ОВ 34 
ор_мога Ом 198 
ор_ми1_м1хеа 00 0 
.соде 
_мыТ_мог@д$ ргос 
тоу АХ. ор1_мога 
тоу ВХ. ор2_мога 
ты1 ВХ 
оу мог рёг ор1_ти1_ор2. АХ 
тоу мога рёг ор1_ми1Т_ор2+2. ОХ 
Теа ЕАХ. ор1_ми1_орё 
ге 
_ му] _мога$ епар 
_му1_т1хед ргос 
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тоу7х АХ. ор_Буе 
поу ВХ. ор мога 
МТ ВХ 
у  мога рёг ор ми] _п1хед. АХ 
у  мога рёг ор _миТ_м1хед+2. 0х 
1еа  ЕАХ. ор ми]_лйхед 
геё . 
_мыу?_лйхед епар 
епа 


В процедуре _пи1_п1хед для расширения размерности операнда ор_Бу{е использу- 
ется команда поу2х (Моуе мИВ 7его-Ежеп4 — копирование с расширением нуля). 
Результаты выполнения процедур. равны 888 и 6732 для _ти]_мога$ и _ти1_плхед 
соответственно. 

При знаковом умножении используется команда 1ти1. В следующем примере 
демонстрируется умножение однобайтового отрицательного операнда на двойное 
слово, реализованное в процедуре _1ти1_пт1хед (листинг 8.12). 


Листинг 8.12. Умножение знаковых чисел (32-разрядная версия) 


.686 

„тоде] РТаф 

орё1оп сазетар: попе 

„ава 
ор_Бу{е ОВ -31 
ор_@мога 00 750 
ор_1ти1_т1хед 090 
.соде 


_ ти? лИхед ргос 
поузх АХ. ор_БУе 


моузх ЕАХ. АХ 
ту — ЕВХ, ор _Фога 
1ти1  ЕВХ 


У — Омюга рёг ор_1ти]_т1хед. ЕАХ 

ту — бмога рег ор 11 хед+4. ЕОХ 

]еа ЕАХ, ор_1ти1_т1хед 

ге 

_1ми1_пухед епар 
епа 

Вэтом примере задействованы два операнда: ор_Бубе размером в 1 байт и двух- 
словная переменная ор_4мога. Результат операции помещается в 8-байтовую пере- 
менную ор_1ти1_п1хед и при указанных значениях операндов равен —23 250. Перед 
выполнением умножения необходимо расширить размерность операнда ор_Бу{е 
до двойного слова. Для этого используются две команды поузх (Моуе \иЬ еп 
Ежеп4 — копирование с расширением знака). 

Первая команда поузх помещает 8-байтовый операнд в 16-разрядный регистр 
АХ, расширяя знак на старшую половину АХ (регистр АН). Вторая команда поузх 
преобразует 16-разрядное значение в 32-разрядное и помещает его в регистр ЕАХ. 
Обратите внимание на то, что используется именно команда поузх, а не поу2х! Ко- 
манда поу2х применяется только для беззнаковых операндов или в случаях, когда 
знак операнда не имеет значения. 
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Хочу заметить, что если множимое и множитель имеют одинаковый знаковый 
бит, то команды пи] и 1ти1 генерируют одинаковый результат. Но если сомножите- 
ли имеют разные знаковые биты, то результатом выполнения команды пи] будет 
положительное число, в то время как команда 1ти1 даст отрицательное значение. 

При решении практических задач очень часто требуется умножать операнды, 
состоящие из нескольких байтов или слов. Это позволяет находить произведение 
очень больших чисел, что требуется в различных задачах экономики и математики. 

В этом случае операция умножения может выполняться для операндов размером 
в байт или слово. Хочу напомнить, что максимальное знаковое значение слова не 
может превышать +32 767, поэтому умножение больших чисел требует некото- 
рых дополнительных операций. Один из простых вариантов умножения больших 
чисел предполагает попарное умножение отдельных слов и сложение получен- 
ных результатов. Алгоритм этой процедуры напоминает умножение столбиком 
при нахождении произведения десятичных чисел, 

Далее рассмотрим пример умножения двух беззнаковых чисел, каждое из кото- 
рых представлено двойным словом. Результат произведения сохраняется в 64-раз- 
рядной переменной. Программный код процедуры (назовем ее пи] _ п 1Буе$) 
представлен в листинге 8.13. 


Листинг 8.13. Умножение беззнаковых чисел размером в двойное слово 
(32-разрядная версия) 


.686 
‚люде] ЕТа* 
ор&1оп сазетар: попе 
. Чата 
0р1 00 32267 ; |младшее слово = Б |старшее слово = а | 
орг 00 17904 : [младшее слово = а |старшее слово = с | 
гез 000 
.соде 
_му1_ ми е1Бусе$ ргос 
Теа ЕЗГ. ор1 : помещаем адрес ор? в ЕТ 
]Леа ЕОТ, ор? : помещаем адрес орг в ЕбТ 
: вычисляем частичное произведение Б * 9 
с1с 
ту АХ. мога рёг [ЕЗГ] ; помещаем Б в АХ 
ризй ЕАХ : сохраняем ЕАХ 
ту ВХ. мога рёг [ЕОГ] : помещаем @ в ВХ 
пи] ВХ : умножение АХ * ВХ 
му  мога рёг гез, АХ :; сохраняем младшую часть результата 
му  мога рг гез+2. 0Х ; сохраняем старшую часть результата 
рор ЕАХ ; извлекаем ЕАХ для вычисления второго произведения 


; Вычисляем частичное произведение Б * с 
тоу ВХ. мюга рёг [Е0Т]+2 ; помещаем с в ВХ . 

мт ВХ : умножение АХ * ВХ 

а44  \мога ри" гез+2. АХ сложение частичных произведений Б * диБ*с 
ас  мога рёг гез+4. ОХ; учесть перенос 


дас  пеж : возник перенос? 
11с  мог@ рёг гез+6 : да. нужно его учесть в старшем слове 
пехё: 


вычисляем частичное произведение а * 4 


ВТ: 


му 
ми] 
а94 
адс 
Теа 
ге 


АХ. мога р&г [Е$Г]+2 
ЕАХ 

ВХ. иога рёг [ЕОГ] 
ВХ 

мога рёг гез+2. АХ 
мога рёг гез+4. 0Х 
ЕАХ 

В 

мога рфг ге5+6 


ВХ. мога рёг [Е0Т]+2 
ВХ 

мога рёг гез+4. АХ 
мога рёг гез+6. ОХ 
ЕАХ. гез 


ми Е 1Буфе$ епар 


епа 


8.4. Обработка целых чисел 


помещаем а в АХ 


: сохраняем ЕАХ 
: помещаем 4 


в ВХ 


; умножение АХ * ВХ 

; прибавляем а * 4 к полному произведению 

: учесть перенос 

: извлекаем ЕАХ для вычисления четвертого произведения 
: возник перенос 

; да, нужно его учесть в старшем слове 


; вычисляем частичное произведение а * с 


помещаем с в ВХ 


: умножение АХ * ВХ 


: прибавляем а * с к полному произведению 
: учесть перенос 
; поместить в ЕАХ адрес произведения 


185 


Проанализируем алгоритм работы процедуры. Умножение операндов ор1 и ор2 
выполняется пословно. Обозначим составные части двойных слов ор1 и ор2 сле- 
дующим образом: 


Ь — младшее слово ор1; 
а — старшее слово ор1; 
Я — младшее слово ор2; 
с — старшее слово ор2. 


Для нахождения произведения в целом вычисляются произведения 16-раз- 
рядных множителей ф ха, р хс, аха, ахс и находятся частичные суммы этих 
произведений с учетом их позиции в полном произведении. При заданных значе- 
ниях операндов произведение равно 577 708 368. 

Эту процедуру можно задействовать при вычислении произведения беззнако- 
вых целых чисел в программах на языках высокого уровня. Например, программ- 
ный код простейшего 32-разрядного приложения на \У15иа| С++, использующего 
процедуру _ми1_ми1+1Бутез, мог бы выглядеть так, как показано в листинге 8.14. 


Листинг 8.14. Демонстрационная программа для процедуры из листинга 8.13 


Нистиде <510.1> 
ехбеги "С" 1п* ми] ти 1Бусе$ (уо1а); 
116 татп(уота) 


рг1пёР(“Вези1® МИЕТТВУТЕ МУЕ и\п". *ти1_ми1Е1Буе$()) 
гебигп 0: 


} 


Эффективность операций умножения можно повысить, если использовать 
несколько простых приемов. Например, при умножении на степень числа 2 (2, 4, 
8 ит. д.) эффективнее вместо умножения выполнять логический сдвиг влево на 
требуемое число битов. Сдвиг более чем на 1 требует загрузки величины сдви- 
га в регистр С!. 
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Рассмотрим несколько примеров. Предположим, что множимое находится 
в одном из регистров АЁ или АХ. Тогда для умножения на 2 содержимого АЕ можно 
использовать команду 


$11 АЁ.1 
Для умножения содержимого АХ на 8 можно воспользоваться такими командами: 


тои (1. 3 
$1 АХ. СЁ 


Рассмотрим, как выполняется операция деления в процессорах [ие]. Для 
деления беззнаковых данных используется команда Ч1\, а для знаковых — 191у. 
Какую из этих команд выбрать, решает разработчик программы. В зависимости 
от размерности операндов существуют следующие форматы операции деления: 


» Деление слова на байт. Делимое находится в регистре АХ, а делитель — в бай- 
те памяти или в однобайтовом регистре. После деления остаток помещает- 
ся в регистр АН, а частное — в А|. Операция с данными типами операндов 
имеет ограниченное применение из-за небольшого диапазона допустимых 
значений (однобайтовое частное не превышает +255 для беззнакового 
деления и +127 — для знакового). 


® Деление двойного слова на слово. Делимое находится в регистровой паре 
ОХ: АХ, а делитель — в слове памяти или в регистре. После деления оста- 
ток помещается в регистр ОХ, а частное — в регистр АХ. Частное в одном 
слове допускает максимальное значение +32 767 для беззнакового деления 
и +16 383 — для знакового. 


® Деление учетверенного слова на двойное слово. Делимое находится в реги- 
стровой паре ЕОХ:ЕАХ, а делитель — в двойном слове памяти или в регистре. 
После деления остаток помещается в регистр ЕБХ, а частное — в регистр ЕАХ. 


Команды 41\ и 191\ имеют единственный операнд, являющийся делителем. 
Рассмотрим следующую команду: 


@1\у 01\1508 


Если переменная 01/1508 определена как байт, то предполагается деление сло- 
ва на байт. Если переменная 01\1$08 определена как слово (0и), то операция пред- 
полагает деление двойного слова на слово. При делении, например, 13 на 3 полу- 
чается результат 4 . Частное будет равни м 4, а остаток — 1. 

Флаги состояния СЕ, ОЕ, $Е и 2Е после выполнения команд 41\ и 191\ не опре- 
делены. 

В качестве примера рассмотрим деление 64-разрядного беззнакового числа на 
однобайтовое целое. Программный код процедуры (назовем ее _41\ 49 Буе) при- 
веден в листинге 8.15. 


Листинг 8.15. Деление беззнакового 64-разрядного числа на байт (32-разрядная версия) 


.686 
.тоде] Е а% 
орЁТоп сазетар: попе 
. дата 
Чио1ете 000 
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гета1паег 00 0 
91\14епа 00 1398 
91у150г ОВ 67 
.соде 
_@1у_94 Буе ргос 
моу2х ВХ. 91%150г 
тоугх ЕВХ. ВХ 
тоу  ЕАХ. Члога рёг Ч1у1депа 
му  Е0Х. 0мога рег 91\/19епд+4 
Чу  ЕВХ 
моу диете. ЕАХ 
оу  гетатпаег, ЕОХ 
ге 
_91\_94 Буе епар 
ета 


Проанализировать программу несложно. Делимое находится в 8-байтовой 
переменной 41\14еп4, а делитель — в переменной 41\150г. Вначале преобразуем 
делитель в двойное слово с помощью следующих двух команд: 


тоу2х ВХ. 91\150г 
моу2х ЕВХ. ВХ 


Затем подготавливаем операцию деления. Для этого помещаем младшее двой- 
ное слово делимого в регистр ЕАХ, а старшее двойное слово переменной 41\14епд — 
в регистр Е0Х. Наконец, после выполнения операции деления сохраняем частное 
в переменной дио1етф, а остаток — в переменной гета1пдег. 

Деление знаковых чисел выполняется с помощью команды 191%. Модифици- 
руем предыдущий пример таким образом, чтобы программа могла работать со 
знаковыми данными. Для этого нужно заменить команду 91\ на 191\ и исполь- 
зовать вместо команд тоу2х команды поузх (поскольку мы имеем дело со знаковы- 
ми операндами). Исходный текст процедуры (назовем ее _141\_49_рубе) показан 
в листинге 8.16. 


Листинг 8.16. Деление 64-разрядного знакового числа на байт (32-разрядная версия) 


.686 
„одет РТае 
орЁЛоп сазетар: попе 
„дата 
_дио1ете 000 
_геталпадег 00 0 
@1у14ета 00 1398 
91у150г 08 -93 
„сое 
_1@1у_99 Бубе ргос 
тоузх ВХ. 41%150г 
пмоузх ЕВХ. ВХ 
тоу  ЕАХ. Фмога рёг @1у1депа 
тоу  Е0Х. мог рёг 91\19епд+4 
141, ЕВХ 
тоу  _ЧиотЛете. ЕАХ 
тоу  гета1паег. ЕБХ 
ге 
_191у_@4_Буее епар 
епа 
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В результате деления получаем частное, равное -15, и остаток, равный 3. 

Хочу заметить, что если делимое и делитель имеют одинаковый знаковый бит, 
то команды 01% и 191у генерируют одинаковый результат. Но если делимое и де- 
литель имеют разные знаковые биты, то команда 41у генерирует положительное 
частное, а команда 191\у — отрицательное частное. 

В некоторых случаях можно добиться повышения производительности при 
выполнении операций деления на степень числа 2 (2, 4, ит. д.). В этом случае 
более эффективным является сдвиг вправо на требуемое число битов. 

Рассмотрим примеры (предполагаем, что делимое находится в регистре АХ) 
деления. Деление на 2: 


$Нг АХ.1 
Деление на 8: 


моу (1.3 
$8" АХ. СЕ 


При использовании команд Ч1\ и 141у может возникнуть переполнение, что 
вызывает прерывание. Подобная ситуация может случиться при делении на ноль, 
а также не исключается при делении на 1. Чтобы избежать подобных ситуаций, 
рекомендуется следовать таким правилам: 


® если делитель — байт, то его значение должно быть меньше, чем старший 
байт (АН) делителя; 


® если делитель — слово, то его значение должно быть меньше, чем старшее 
слово (0Х) делителя. 


Для указанных случаев частное может превысить предельно допустимое зна- 
чение. Во избежание подобных ситуаций полезно выполнять проверку делителя 
до выполнения команд Чу и 191%. В следующем примере предполагается, что пере- 
менная О1УТ50В является однобайтовым числом, а делимое находится в регистре АХ: 
.Чафа 

ОТ\УТ50В 08 ? 
.соде 


стр АН, 011508 
5 омегЯом 
91у — 011508 
омег ом: 
< обработчик переполнения> 


Во втором примере предполагаем, что 01/1508 — двухбайтовый делитель, а де- 
лимое находится в регистровой паре ОХ:АХ. Программный код для проверки мог 
бы выглядеть так: 


"дата 
01%1$08 ОМ ? 
.соде 
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стр 0х. 0141508 
35  омегом 
Фу — 0141508 


оуег 1 ом: 
< обработчик переполнения> 


Для команды 191% необходимо учитывать тот факт, что либо делимое, либо 
делитель может быть отрицательным, а так как сравниваются абсолютные значе- 
ния, то нужно использовать команду пед для временного преобразования отрица- 
тельного значения в положительное. 

Команда пед обеспечивает преобразование знака двоичных чисел из плюса в ми- 
нус и наоборот. Эта особенность может быть использована при нахождении абсо- 
лютной величины (модуля) числа. В практическом плане команда пед устанавли- 
вает противоположные значения битов и прибавляет 1. Вот некоторые примеры: 

пед АХ 


пед В 
пед МЕМОМАЦИЕ 


Здесь МЕМОМАШЩЕ — байт или слово в памяти. 

Преобразование знака для 32-разрядного (или большего) числа требует до- 
полнительных шагов. В качестве примера рассмотрим преобразование знака для 
32-разрядного числа, находящегося в регистрах ОХ:АХ. Поскольку команда пед не 
может обрабатывать два регистра одновременно, то ее непосредственное приме- 
нение приведет к неправильному результату. Для правильного преобразования 
необходимо выполнить такую последовательность команд: 

поЕ 0%: инвертирование битов в 0Х 

поЕ АХ : инвертирование битов в АХ 


а44 АХ.1 :; прибавление ] к АХ 
ас 0Х.0 ; прибавление переноса к 0Х 


8.5. Обработка данных в форматах АЗСП и ВСО 


Для получения высокой производительности компьютер выполняет арифмети- 
ческие операции над числами в двоичном формате. Во многих случаях новые 
данные вводятся программой с клавиатуры в виде АЗСП-символов в десятичном 
формате. Аналогично, вывод информации на экран осуществляется в АЗСП-кодах. 
Например, число 23 в двоичном представлении выглядит как 00010111, ав шест- 
надцатеричном — как 171. В АЗСП-коде на каждый символ требуется один байт, 
поэтому число 25, например, в АЗСП-коде имеет внутреннее представление 32351. 

Далее мы рассмотрим технику преобразования данных из формата АЗСП в дво- 
ичный формат для выполнения арифметических операций и обратного преобра- 
зования двоичных результатов в формат АЗСП для вывода на экран или принтер. 

Как уже было сказано, данные, вводимые с клавиатуры, имеют формат АЗСИ, 
например, буквы ПМТ имеют в памяти шестнадцатеричное представление 494Е54, 
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цифры 1234 — шестнадцатеричное представление 31 323 334. В большинстве слу- 
чаев формат символьных данных, например фрагментов текста, программой не 
изменяется. В то же время для выполнения арифметических операций над число- 
выми величинами необходима специальная обработка. 

Процессор позволяет производить такую обработку с помощью специальных 
ассемблерных команд, предназначенных для выполнения арифметических опера- 
ций непосредственно над числами в формате АЗСП: 


® ааа (АЗСИ Ааазё юг АЯ оп) — коррекция для сложения АЗСП-кода; 
» аа4 (АЗСИ Ад}азЕ Юг О5юп) — коррекция для деления АЗСП-кода; 


» аат (АЗСПИ Ада юг МшарЙсаНоп) — коррекция для умножения АЗСП- 
кода; 


® аа5 (АЗСПИ Адазе Юг Зи гасНоп) — коррекция для вычитания АЗСП-кода. 


Эти команды кодируются без операндов и выполняют автоматическую кор- 
рекцию содержимого регистра АХ. Коррекция необходима, так как АЗСП-код пред- 
ставляет собой так называемый неупакованный десятичный формат, в то время 
как компьютер выполняет арифметические операции в двоичном формате. 

Рассмотрим более детально процесс сложения чисел в формате АЗСИ, а имен- 
но пример сложения чисел 8 и 4. В шестнадцатеричном формате эти числа равны 
38} и 348. Их сумма равна 6СЬ, что является неправильным значением ни для 
формата АЗСП, ни для двоичного формата. 

Если не брать во внимание левый полубайт (6) и прибавить 6 к правому по- 
лубайту (ОСЬ), то получим 1268, что является правильным результатом, если 
рассматривать это значение в десятичном формате. Это означает, что путем опре- 
деленных преобразований можно получить правильный двоично-десятичный фор- 
мат результата сложения. Рассмотрим практический пример, иллюстрирующий 
вышесказанное. Программный код примера выглядит так: 


.Чафа 
пит] ОВ 348 
пише ОВ 388 
.соде 


хог АХ. АХ 
му Ас. пи 
поу В... питё 
244 АС. В 


Из примера видно, что регистр АЕ содержит значение 38$, а регистр ВЕ — 348. 
Числа 38 и З4В представляют собой два байта в формате АЗСП. После выпол- 
нения сложения (команда а44 АЕ, ВЕ) регистр АЕ будет содержать значение 6СРВ. 
После выполнения коррекции (команда ааа) регистр АХ будет содержать неупако- 
ванное двоично-десятичное число 01025. 

Команда ааа проверяет правый полубайт (4 бита) в регистре А". Если его зна- 
чение находится между Аи Е или флаг АЕ равен 1, то к регистру АЕ прибавляется 6, 
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к регистру АН прибавляется 1, а флаги АЕ и СЕ устанавливаются в 1. Кроме того, ко- 
манда ааа устанавливает в 0 левый полубайт в регистре АЕ. 

Для того чтобы получить символьное представление АЗСП-числа, необхо- 
димо выполнить операцию поразрядного ИЛИ над левым полубайтом результата 
с помощью команды ог. Для регистра АХ эта операция будет выглядеть так: 


ог АХ. 3030Н 


Рассмотренный пример демонстрирует основные принципы сложения од- 
нобайтовых чисел в формате АЗСИ. Сложение многобайтовых АЗСП-чисел тре- 
бует организации цикла, который выполняет обработку справа налево с учетом 
переноса. 

Следующие примеры представляют собой небольшие программы, демонстри- 
рующие различные аспекты сложения АЗСП-чисел, а также вывод результатов 
на экран дисплея или их передачу другим программам. Первый пример иллюст- 
рирует сложение двух однобайтовых АЗСП-чисел и вывод результата на экран. 
Это простое 16-разрядное приложение М5-2О$, программный код которого 
показан в листинге 8.17. 


Листинг 8.17. Сложение двух однобайтовых чисел в АЗСП-представлении 
(16-разрядная версия) 
„тоде] зта11 
„Фата 
пит ОВ '9* 
пита ОВ '5° 
зип ОВ 2 0ЩР ('') 
.с0де 
$фаг{: 
тоу АХ. @дата 
тоу 05. АХ 
С1с : очистка флага переноса и регистра АХ 
хог АХ. АХ 
моу АС. пит] : заносим первое число в АЁ 
ас АЁ. пита : сложение с пит с учетом переноса 
ааа : коррекция результата 
ог АХ. 30301 : преобразование в символьное представление 
хсп9 АН. АЁ ; обмен байтами для подготовки вывода на экран 
му могд ртг зит. АХ :; сохранение результата в переменной $ит 
: вывод результата на экран 


тои СХ. 2 : помещаем число выводимых байтов в регистр СХ 
тоу АН. бИ 
1еа $1. 5ит ; помещаем адрес переменной $им в $1 
пех: 
том ОЕ. Буфе руг [$1] : помещаем выводимый байт в регистр 0 
1 211 : вывод на экран 
1ис $1 : заносии адрес следующего символа в $1 
100р пехё : повтор цикла 
тоу ах, 4с00п 
11 211 
еп $фагё 


ета 
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Пример сложения АЗСИ-чисел в 32-разрядных У/Л/ш4о\з-приложениях вы- 
глядит сложнее. Здесь выполняется сложение четырехбайтовых чисел пит] и пита, 
а результат помещается в переменную зип. Операция сложения реализована в ви- 
де процедуры _а04_а$с, возвращающей адрес результата в 32-разрядном регистре 
ЕАХ. Операция сложения выполняется, начиная с младших байтов (они располо- 
жены в старших адресах переменных пит! и пит2). После выполнения процедуры 
переменная зип содержит значение 1023. 

Процедуру можно усовершенствовать и использовать как в программах на 
ассемблере, так и в приложениях, написанных на языках высокого уровня. Ис- 
ходный текст процедуры _а04 азс показан в листинге 8.18. 


Листинг 8.18. Сложение АбСП-чисел (32-разрядная версия) 


.686 

‚моде Р]а* 

орЁ1оп сазетар:попе 

.Фафа 
пит ОВ '0037' 
1еп1 ЕО $-пит1 
пи? ОВ '0986' 


зим ОВ 4 0ЩР (’') ; резервируем память для результата 

.с0де 

_а94 а$с ргос 
тоу ЕСХ. 1еп1 ; помещаем размер операндов (в байтах) в ЕСХ 
Сс : очистка флага переноса 


: побайтовое сложение в цикле 
ада1т: 
моу АЁ. Буте рёг пит [ЕСХ-1] : помещаем младший байт пит] в АЁ 
а4с А. Буе рёг питё[ЕСХ-1] : сложение с таким же байтом в пита 
ааа ; коррекция результата 
моу Буфе рёг зи] ЕСХ-1]. АЕ ; сохранение результата 
: в соответствующем байте переменной 
; $МИ 
Тоор ада1п 
а4с Бу{е рег зит[ЕСХ-1]. 0 ; коррекция результата 
ог (ога рёг зим. 303030300 : преобразование в символьный вид 


]1еа ЕАХ. $ит : сохраним адрес результата в регистре 
: РАХ 
ге 
_а99 азс епар 
епа 


Перейдем к более детальному рассмотрению операций вычитания чисел, пред- 
ставленных в формате АЗСП. При вычитании таких чисел, так же как и при 
сложении, требуется коррекция результата. Именно этим целям и служит ко- 
манда аа$. 

Она выполняется аналогично команде ааа. Команда аа$ проверяет правый по- 
лубайт в регистре А+. Если его значение находится в диапазоне А - Ё или флаг АЕ 
равен 1, то из регистра АЁ вычитается 6, а из регистра АН вычитается 1, при этом 
флаги АР и СЕ устанавливаются в 1. Во всех случаях команда аа5 помещает нули 
в левый полубайт регистра А". 
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Следующие примеры демонстрируют использование команды аа5. Исходный 
текст первого примера выглядит так: 


„Чата 
0р1 08 381 
ор? 08 341 
.соде 


пои А. ор]: ЗВ в А. 
зир А, ор? ; А. - 381 = 041 
аа$ ; А. после коррекции: 04П 


В этом примере коррекция команде ааз не требуется. Следующий пример де- 
монстрирует более сложный случай: 


„дата 


ор1 (В 381 
ор? ОВ 341 
.соде 


поу АЕ, ор2 : 341 в А 
зи А. ор] : А. - 34 = ЕСИ 
аа$ : АХ после коррекции: ОЕЕОбИ 


В’этом примере из-за того, что правая цифра в регистре АЁ равна ОС, команда 
аа5 вычитает 6 из регистра АЁ и 1 из регистра АН и устанавливает в 1 флаги АР и СЕ. 
Результат равен —4 (0ЕЕО6бЪ), то есть десятичное дополнение числа 4. 

Далее рассмотрим более сложные примеры вычитания чисел в формате АЗСП. 
Вычитание однобайтовых АЗСП-чисел продемонстрировано в приложении М$-РОЗ, 
программный код которого напоминает рассмотренный ранее пример 16-разряд- 
ной программы сложения (см. листинг 8.17). Модифицированная версия имеет 
следующие отличия: команда сложения адс здесь заменена командой вычитания 
$56, а для коррекции результата вместо ааа применяется команда аа5. Исходный 
текст примера показан в листинге 8.19. 


Листинг 8.19. Вычитание АЗСП-чисел (16-разрядная версия) 


лоде] $та11 
„Фата 
пит ОВ '8' 
пит? ОВ '3' 
.соде 
зфаг{: 
тоу АХ. @дата 
тоу 0$. АХ 
С1с ; очистка флага переноса 
тои А. пит1 : первое число в АЁ 
$55 А. пит? —: вычесть второе с учетом возможного заема 
аа$ : коррекция результата 
ог А. Зо! ; преобразовать результат в символьное представление 
; вывод на экран 


ту 01. А. 
продолжение „7 
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Листинг 8.19 (продолжение) 
тоу АН. 6И 
116 21п 
тоу ах, 4с00и 
11% 211 
епФ $тагт 
епд 


Следующая 32-разрядная процедура также демонстрирует вычитание АЗСП- 
чисел. Процедура называется _$и6 азс, а программный код напоминает тот, что 
используется в процедуре _а04_ас (см. листинг 8.18). Различие состоит в том, что 
вместо соответствующих команд для сложения применяются команды для вычи- 
тания. Кроме того, операнд пит1 должен быть больше пип2. При желании процеду- 
ру _546 азс можно модифицировать для работы с произвольными операндами. 
Исходный текст процедуры представлен в листинге 8.20. 


Листинг 8.20. Вычитание А$СП-чисел (32-разрядная версия} 


.686 

.тое1 Раф 

орЕ1оп сазетар:попе 

.дата 
пит? ОВ '0737' 
1еп1 Е0Ц $-пит1 
пит? ОВ '0086' 
$и6$ ОВ 4 ПР ('°) 

.с0де 

_$\6_азс ргос 
тои ЕСХ. 1еп1 
С1с 

ада1п: 
поу АЁ. Буфе рёг пит ЕСХ-1] 
$66 А. Буфе рёг питё[ЕСХ-1] 
аа$ 
тоу Буе рёг зи6$[ЕСХ-1]. А 
1оор ада1п 
$66 Бубе рёг $и6$[ЕСХ-1]. 0 
ог Фиог@ рёг $и65. 303030300 
1еа ЕАХ. $465 
ге 

_$46_азс епар 

епа 


Думаю, что нет смысла комментировать этот пример, поскольку он похож на 
ранее рассмотренный пример сложения чисел. 

Следующая тема, которую мы рассмотрим, — умножение чисел, представлен- 
ных в формате АЗСНИ. При умножении АЗСП-чисел результат уже не будет яв- 
ляться АЗСП-числом. Для преобразования результата в формат АЗСП необходи- 
мо выполнить дополнительно команду аам. 

Команда аат выполняется после умножения двух неупакованных двоично-де- 
сятичных чисел. Она преобразует результат умножения, являющийся двоичным 
числом, в правильное неупакованное двоично-десятичное число, младший раз- 
ряд которого помещается в регистр АЁ, а старший — в АН. 
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Следует заметить, что коррекция осуществляется только для одного байта за 
одну операцию, поэтому можно умножать только однобайтовые поля — для более 
длинных полей необходима организация цикла. 

Команда аат делит содержимое регистра АЁ на 10 и помещает частное в регистр АН, 
а остаток — в А. Рассмотрим простой пример: 


"ааа 
0р1 08 37 
орг ОВ 39 
.соде 
поу АЕ. ор1 
ту (1. орг 
ап (1.0ЕН : преобразовать содержимое СЕ в неупакованный формат 
: (СЕ = 09) 
ап АЁ.ОЕН : преобразовать содержимое АЁ в неупакованный формат 
; (А = 07) 
пит (1 ; умножить АЁ на СЁ 
аат : преобразовать содержимое АХ в неупакованный 


: двоично-десятичный формат 
ог АХ.З0З0Н : преобразовать содержимое АХ в формат АЗСТ1 


Г 

После выполнения команды пи] в регистре АХ будет находиться число 63 (003ЕВ). 
Далее команда аат делит это число на 10, записывая частное 06 в регистр АН и оста- 
ток 03 в регистр АЕ. После этого команда ог выполняет преобразование неупако- 
ванного десятичного числа в формат АЗСИ. 

Рассмотрим деление чисел, представленных в формате АЗСИ. При делении 
АЗСП-чисел применяется команда аа4, которая выполняет корректировку АЗСП- 
кода делимого непосредственно перед выполнением операции деления с помощью 
команды 91у. Перед использованием команды аад необходимо обнулить левые полу- 
байты АЗСП-кодов для получения неупакованного десятичного формата. Следует 
отметить, что команда зад может оперировать двухбайтовым делимым в регистре АХ. 

Следующий фрагмент программного кода наряду с подготовкой операндов 
к делению выполняет коррекцию для последующего деления. Предположим, что 
переменная ор1 содержит делимое 32386 в формате АЗСИ, а переменная ор2 — де- 
литель 37Ь также в формате АЗСИ. Программный код, выполняющий деление 
АЗСП-чисел, выглядит так: 


"дата 


0р1 ОМ 32381 

ор? ОВ 370 

.с0де 
хог АХ. АХ 
оу АХ. 9р1 
ту (1. ор2 
ап АХ. ОРОРН : преобразовать АХ в неупакованное число 
апа (1. ОРп ; преобразовать СЕ в неупакованное число 
аад : преобразовать АХ в двоичный формат 


Чу Ц : деление на 7 
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Команда аад умножает содержимое АН на 10, после чего прибавляет резуль- 
тат 20 к регистру АЁ и очищает регистр АН. 

Следующий пример представляет собой законченное 16-разрядное приложе- 
ние М5-РО$5, демонстрирующее операцию деления АЗСН-чисел и вывод резуль- 
тата на экран (листинг 8.21). 


Листинг 8.21. Деление АЗСП-чисел (16-разрядная версия) 


.тоде] $та11 
„дата 
пит] ОВ '18' 
пит? 08 '2' 
гез В ? 
.соде 
$Фагб: 
тоу АХ. @даба 
моу 0$. АХ 
с1с 
оу АХ. мог рёг пит] : поместить делимое в АХ 
хСИ9 АН. АЁ ; установить правильный порядок байтов 
ап АХ. ОРОЕН ; преобразовать число в АХ в неупакованное 
: двоично-десятичное (АХ = 03061} 
тои (1. пимё : поместить второе число в (1 
апд С. бЕЙ : преобразовать число в СХ в неупакованное 
: двоично-десятичное (С1 = 02и) 
аад : выполнить коррекцию АХ перед делением 
: (АХ = 101) 
у (а 
ог МА. ЗИ ; преобразовать результат в символьное 
; АЗСИ -представление (АЁ = 341) 
моу (1, А: : вывод символа на экран 
: (в 0 - выводимый символ) 
моу АН. 21 
11 211 
тоу ах. 4с00и 
118 210 
еп@ зТагф 
епа 


Следующая тема, которую мы рассмотрим, — операции с упакованными дво- 
ично-десятичными числами, Как уже упоминалось ранее, упакованные числа можно 
только складывать и вычитать без каких-либо промежуточных преобразований. 
Но результат операций нужно корректировать с помощью специальных команд: 


® даа (Рес!та! Адуазтепе Юг АЗ оп) — десятичная коррекция для сложе- 
ния; 

® 045 (Ресипа! Адуазетепе юг Зи гасйоп) — десятичная коррекция для вы- 
читания. 

Команда даа преобразует двоичный результат выполнения команд а09 и абс 


в регистре АЁ в упакованное десятичное число. Продемонстрируем работу этой 
команды на примере: 


"даа 
0р1 0В 321 
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ор? ОВ 591 
.соде 
тоу А. 0р1 
299 А. ор? ; А = ВВП 
даа ; А = 911 


После сложения операндов ор1 и ор2 в регистре А! будет число 8ВВ. Младшая 
цифра результата больше 9, поэтому она преобразуется. Конечный результат ра- 
вен 91, что и требовалось получить. 

Команда даз преобразует двоичный результат выполнения команд $46 и $65 
в регистре АЁ в упакованное десятичное число. Следующий пример демонстриру- 
ет применение этой команды: 

„Чата 

0р1 ОВ 37п 


ор? ОВ 511 
.соде 


поу д. ор2 
тому СЁ. 0р1 


$\6 АЕ. (С : А = 1! 
да$ : А = 141 


8.6. Преобразование А$СП-чисел 
в двоичный формат 


Выполнение арифметических операций над числами в формате АЗСП или ВСО 
удобно лишь для коротких полей. В большинстве случаев для арифметических 
операций требуется преобразование в двоичный формат. На практике намного 
проще преобразовать АЗСП-число непосредственно в двоичный формат, чем пе- 
реводить формат АЗСП сначала в формат ВС, а затем в двоичный формат. 
Метод преобразования базируется на том, что формат АЗСИ имеет основа- 
ние 10, а компьютер выполняет арифметические операции только над числами 
с основанием 2. Алгоритм преобразования состоит в том, что, начиная с самого 
правого байта АЗСП-числа, выполняется такая последовательность шагов: 


1. Устанавливается з 0 левый полубайт каждого байта АЗСП-числа. 
2. АЗСП-цифры умножаются на 1, 10, 100, и результаты складываются. 


Для примера рассмотрим преобразование числа 2459 из формата АЗСИ в дво- 
ичный формат. Полагаем, что результат преобразования будет храниться в реги- 
стре АХ. Вначале обнуляем регистр АХ, после чего считываем цифру в АЗСП-коди- 
ровке, умножаем АХ на 10 и прибавляем двоичное значение цифры в АХ. После 
считывания всех цифр АЗСП-числа 2459 в регистре АХ будет содержаться двоич- 
ное значение числа 2459. Для наглядности можно представить процесс преобра- 
зования в виде таблицы (табл. 8.1). 
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Таблица 8.1. Преобразование АЗСП-числа в двоичное число 


Регистр АХ перед итерацией Вновь извлекаемое число — АХ после итерации 


Ох 10 + 2 = 2 
2х 10 + 4 = 24 
24х10 + 5 = 245 
245 х 10 + 9 = 2459 


Для лучшего понимания алгоритма преобразования приведу пример процеду- 
ры (назовем ее _азс_Ь1п), в которой определяется сумма двух чисел: одно пред- 
ставлено в формате АЗСП, другое является обычным двоичным числом. Сумма 
возвращается в регистре ЕАХ. Подобную процедуру можно использовать в 32-раз- 
рядных приложениях, разработанных на ассемблере или на языках высокого 
уровня. Исходный текст программного кода процедуры _а$с_54п показан в лис- 
тинге 8.22. 


Листинг 8.22. Вычисление суммы АЗСП-числа и двоичного числа (32-разрядная версия) 


.686 
„одет Раф 
орЁ1оп сазетар: попе 
„Чата 
1 а5с ОВ '5749' 
]еп ЕЦЦ $-1_а$с : определяем размер АЗС1!-числа в байтах 
1614" 00 3772 
.соде 
_а$с_Б1п ргос 
с1с ; очистка флага переноса 
Теа  ЕЗГ. 1 а$с : помещаем адрес 1_азс в ЕЗТ - 
тои  ЕСХ. 1еп : сохраняем размер числа в ЕСХ 
хог  ЕАХ, ЕАХ | 
тои ВХ. Ш : помещаем множитель в регистр ВХ 
ада1п: 
пи? ВХ : АХ * ВХ 
тоу 0. БУ\е рёг [ЕП] ; загружаем очередную цифру АЗС -числа в 0 
апа 01. бЕН : очищаем левый полубайт 
тмоутх ОХ. 0 : расширяем ОЕ до ОХ для последующего 
; сложения 
а44 АХ, 0Х : сложение частичной суммы и преобразованной 
; АСИ -цифры 
116  Е$1 ; переход к следующему байту АЗСТ-числа 
]Лоор ада1п : следующая итерация 
тоу2х ЕАХ. АХ ; расширение АХ до ЕАХ для выполнения 
; 32-разрядного сложения 
а94  ЕАХ. 1 Б1п : вычисление суммы 1_а$с + 1_Б1п 
: и сохранение ее ЕАХ 
ге 
_а$с_Б1п еп@р 
епа 


При данных значениях переменных 1_а5с и 1_Б1п результат сложения будет 
равен 9521. Процедуру можно вызвать из программы на \!5иа] С++ .МЕТ (ли- 
стинг 8.23). 
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Листинг 8.23. Демонстрационная программа для процедуры из листинга 8.22 
ЯАпсТиде <$1410.1> 

ехфегт "С" Тиё азс_Б1п(\014): 

11% ма1п(\019) 


рг1пёР( "АЗСТТ -пимбег + Блпагу = %4\п". азс_Б1п()) 
гефиги 0: 


} 


8.7. Преобразование двоичных чисел 
в формат АЗСП 


Для того чтобы напечатать или отобразить на экране арифметический результат, 
необходимо преобразовать его в формат АЗСП. Данная операция включает в себя 
процесс, обратный предыдущему: вместо умножения выполняется деление дво- 
ичного числа на 10 до тех пор, пока результат не станет меньше 10. Остатки, нахо- 
дящиеся в диапазоне 0-9, образуют число в формате АЗСП. 

В качестве примера рассмотрим демонстрационную процедуру (назовем ее _Б1п_ 
а5с_5), в которой выполняется преобразование двоичного числа в его АЗСП-пред- 
ставление, после чего полученное АЗСП-число суммируется с другим АЗСП-чис- 
лом, равным 5. Процедура возвращает в регистре ЕАХ 32-разрядный адрес сим- 
вольной строки, содержащей результат сложения АЗСП-чисел. Исходный текст 
процедуры представлен в листинге 8.24. 


Листинг 8.24. Преобразование числа в формат АЗСП с последующим сложением 
(32-разрядная версия) 
. 686 
лоде] 11а 
орё1оп сазетар: попе 
.дафа 
ор_Б1" 94 273 
ор азс 4% Заир ('') 
.соде 
_БАп_а$с_5 ргос 
]Леа ЕЗГ. ор_а$с+2 
тоу ЕАХ. ор п 
тои ЕВХ. 10 
пеж: 
хог ЕОХ. ЕОХ 
Ч1у ЕВХ 
ог ЕОХ, ЗВ 
тоу Буе рёг [ЕЗГ]. 0% 
сир ЕАХ, 10 
Л сораые 
дес ЕЗ 
Зар пех 
сотр1ефе: 
ог ЕАХ, ЗОВ 


ес 51 продолжение :# 
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Листинг 8.24 (продолжение) 


тоу Буе рёг [Е$1]. АЁ 
С1с 
тои АБ. Буфе рёг ор_а$с+2 
а% АМ. '5' 
ааа 
ог А. ЗИ 
тоу Буфе рёг ор_а$с+2. АЁ 
1еа ЕАХ. ор_а$с 
ге 

_61п_а$с_5 епёр 

епа 


8.8. Полезные алгоритмы и программы 


В этом разделе приведены примеры вычислительных процедур, с которыми про- 
граммисту приходится часто сталкиваться на практике. При решении повседнев- 
ных задач в большинстве случаев нужно иметь дело не с одиночными числами, 
а с их множествами, собранными в массивы. Очень часто требуется вычислять 
сумму и разность элементов целочисленных массивов, осуществлять поиск мини- 
мального и максимального значений в массиве, проверять вычисление модулей 
элементов массива и т. д. Приведенные далее примеры могут помочь в решении 
таких задач. Разработчик легко может их модифицировать для своих потребностей. 

Первый пример, который мы рассмотрим, — вычисление суммы элементов 
двух целочисленных массивов. Предположим, имеется два целочисленных мас- 
сива, а1 и а2, состоящие из четырех элементов. Результаты попарного сложения 
элементов массивов заносятся в третий массив зип. Программный код, выпол- 
няющий операции сложения, реализован в процедуре _5ит_1п{$ (листинг 8.25). 


Листинг 8.25. Сложение элементов целочисленных массивов (32-разрядная версия) 


.586 

„оде] Еа+ 

орЁ1оп сазетар: попе 

„Чата 
а1 00 12. -345. -49, 91 
а2 00 -48. 199, -812. 32 


Тел ЕСЦ $-а2 

зим 00 4 УР (0) 
.соде 
_зит_111$ ргос 

тоу ЕСХ. 1еп : размер массивов (в байтах) -> ЕСХ 

$йг ЕСХ. 2 ; коррекция ЕСХ для операций с двойными словами 

: (деление на 4) 

Теа ЕЗТ. а1 : адрес первого элемента массива а1 -> ЕЗ1 

Теа ЕОГ. а2 : адрес первого элемента массива а2 -> ЕОТ 

}еа ЕВХ, $ит ; адрес первого элемента массива $ит -> ЕВХ 
пеж: 

С1с 

хог ЕАХ, ЕАХ : перед выполнением операций очищаем регистр ЕАХ 

тоу ЕАХ, [ЕЗГ] : злемент массива а1 -> ЕАХ 


а4с ЕАХ. [Е0Г] —: сложить с соответствующим элементом массива а2 
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моу [ЕВХ]. ЕАХ : помещаем сумму элементов на соответствующую позицию 
; в массиве зит 

ад ЕЗТ, 4 : переход к адресу следующего элемента в массиве а1 
ада ЕОТ, 4 : переход к адресу следующего элемента в массиве а2 
а44 ЕВХ, 4 : переход к адресу следующего элемента в массиве ит 
1оор пех ; следующая итерация 

]1еа ЕАХ, ит ; адрес массива зит -> ЕАХ 

ге 

_зит_ 116$ епар 

епа 


Думаю, исходный текст процедуры не вызывает затруднений. Хочу лишь обра- 
тить внимание, что поскольку здесь выполняются операции над двойными слова- 
ми, то счетчик ЕСХ должен содержать их количество (в данном случае — 4). Кроме 
того, следует учитывать, что последующие элементы массивов размещены по 
адресам, на 4 большим текущего. 

Если нужно складывать элементы, представленные словами, то некоторые 
команды в данной процедуре следует изменить: 


5йг ЕСХ, 2 
Вместо этой команды нужно использовать такую: 
$йг ЕСХ. 1 


Кроме того, при переходе к следующим элементам массивов требуются команды 


а49 Е5Т. 2 
аа ЕОТ. 2 
ада ЕВХ. 2 


Процедуру можно легко модифицировать для работы с произвольным коли- 
чеством элементов в массивах. 

Для большинства практических применений размерности двойного числа до- 
статочно для получения корректного результата. Однако иногда приходится иметь 
дело с очень большими числами, для которых разрядности двойного слова может 
оказаться мало. Следующий пример демонстрирует вычисление сумм 64-разряд- 
ных элементов целочисленных массивов а1 и а2. Результат, как и в предыдущем 
примере, помещается в массив 5\т. Операция сложения реализована в процедуре 
_$ит_11$_64, которая возвращает в регистре ЕАХ адрес массива зим (листинг 8.26). 


Листинг 8.26. Сложение 64-разрядных элементов массивов (32-разрядная версия) 


.586 
„тоде] Наф 
ор&1оп сазетар: попе 
„дата 
а1 00 123980127. -1296432345. -971743249. 9740391 
а2 00 -48094715. 81199054. -81283467. 340917622 
1еп ЕОУ $-а2 
ит 00 4 0Р (0) 
.соде 
_зит_116$_64 ргос 
тоу ЕСХ, Теп 
$Иг ЕСХ. 3 
Теа ЕЗТ, а1 
1еа ЕОТ. а2 


Теа ЕВХ. зит 
продолжение „7 
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Листинг 8.26 (продолжение) 


пех: 
с1с 
хог ЕАХ. ЕАХ 
тоу ЕАХ. Фмюга рёг [Е$Г] 
а99 ЕАХ. ога рёг [ЕОТ] 
тоу Чиога рёг [ЕВХ]. ЕАХ 
тоу ЕАХ, Омога рёг [Е$1+4] 
адс ЕАХ. @мога р\г [Е01+4] 
тоу Омога рёг [ЕВХ+4]. ЕАХ 
ада ЕЗТ, 8 
ааа ЕОТ. 8 
ааа ЕВХ. 8 
Тоор пех 
Теа ЕАХ. зит 
ге 
_$ит_111$_64 епар 
епа 


Особенностью работы этой процедуры является то, что сложение 64-разряд- 
ных операндов реализовано через попарное сложение 32-разрядных частей этих 
операндов. Алгоритм сложения построен следующим образом: вначале складывают- 
ся младшие 32-разрядные части, затем — старшие с учетом возможного переноса 
из младшей части. После этого младшая и старшая части 64-разрядного результата. 
сохраняются в младшей и старшей частях соответствующего элемента массива зип. 

Переход к следующим элементам массивов выполняется путем прибавле- 
ния значения 8 к указателям на текущие элементы. В счетчике ЕСХ содержится 
количество 8-байтовых элементов. При указанных значениях элементов массивов 
а1 и а2 элементы в массиве зип равны 75 885 412, —1 215 233 291, -1 053 026 716, 
350 658 013. Такую процедуру можно модифицировать для работы с произволь- 
ным количеством элементов массивов. 

Процедура может быть использована в вычислительных алгоритмах для боль- 
ших чисел в различных программах. Например, следующее консольное 32-раз- 
рядное приложение на У!5иа! С++ МЕТ выполняет вывод на экран результатов 
работы процедуры _зит_11ё$_64 (листинг 8.27). 


Листинг 8.27. Демонстрационная программа для процедуры из листинга 8.26 


ЗНисТиде «510. 1> 
ехфегп "С" 1опд 10п9 1п* $ит_11$_64(у019): 
1$ ма1п(\019) 


1оп9 1оп9 1п%* р1опд = $ит_116$_64(); 
ре1пЕР("\п\п\ бит оф 1опд аггау:\п”); 
Фог (11 11 = 0; 11 <4; 11++) 


{ 
ри4иЕЕ ("8119 ", *р1опд++); 


гефигп 0: 
} 
Рассмотрим еще одну задачу, с которой часто сталкиваются программисты, — 
вычисление суммы элементов целочисленного массива. Реализация алгоритма 


нахождения суммы 64-разрядных элементов показана в процедуре _зит_64 (ли- 
стинг 8.28). 
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Листинг 8.28. Вычисление суммы 64-разрядных элементов целочисленного массива 
(32-разрядная версия) 
.586 
„тоде] т1аф 
оре1оп сазетар: попе 
.бафа 
1аггау 00 9234764129, -16097233481. -7565902112, 39094647921 
]еп ЕОУ $-1аггау 


Зи 000 
.с0де 
_зит_64 ргос 

тоу ЕСХ. Теп ; раэмер массива Таггау (в байтах) -> ЕСХ 

$Иг ЕСХ, 3 ; преобразовать размер в количество учетверенных слов 

]Теа ЕЗТ, Таггау : адрес массива -> Ез1 

Теа ЕБГ, зит ; адрес переменной зит -> ЕБТ 

С1с 
пех{: 

тоу ЕАХ, Чиюга рёг [Е$1] ; младшее двойное слово элемента 

; массива-> ЕАХ 
а94 @мога р®г ГЕОТЗ,ЕАХ ; прибавить к младшему двойному слову 


; общей суммы 
поу ЕОХ. дмога рёг [Е$1+4] ; старшее двойное слово элемента 
р ; массива -> ЕОХ 
ас дмога рег [ЕО1+4], ЕОХ ; прибавить к старшему двойному слову 
; общей суммы с учетом переноса 


а94 ЕЗТ, 8 ; переход к следующему элементу массива 
с1с ; очистить флаг переноса 
Тоор пех ; следующая итерация 
1еа ЕАХ. зит ; адрес переменной $ит -> ЕАХ 
ге 
_вит_64 епар 
епа 


В основе алгоритма суммирования элементов массива лежит тот же подход, 
что и при суммировании 64-разрядных элементов двух массивов в предыдущем 
примере. Текущее значение суммы помещается в переменную зип. В каждой 
итерации к сумме добавляется значение следующего элемента массива. Вначале 
прибавляется младшее двойное слово, затем с учетом переноса — старшее двой- 
ное слово. По завершении цикла адрес переменной зип помещается в регистр ЕАХ 
и возвращается в основную программу. 

При указанных значениях элементов массива после выполнения операции 
суммирования в переменной зип будет находиться значение 24 666 276 457. 

Еще одной весьма распространенной задачей является поиск наибольшего или 
наименьшего элемента в массиве чисел. С помощью программы на ассемблере 
можно довольно просто реализовать алгоритм такого поиска. Следующая процедура 
{назовем ее тах) позволяет найти максимальный элемент в массиве целых чисел. 
Процедура возвращает адрес переменной, содержащей максимальный по значе- 
нию элемент, в регистре ЕАХ. Исходный текст программы показан в листинге 8.29. 


Листинг 8.29. Поиск наибольшего элемента в массиве целых чисел (32-разрядная версия) 


.586 
„тюдет Нае 
орёТоп сазетар: попе 


„дата продолжение 7 
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Листинг 8.29 (продолжение) 


1аггау 00 45, -78. 34. 9. 231. 45. -12 
]еп ЕОУ $-1аггау 
тахуа! 000 
.соде 
ах ргос 
]1еа Е$1. Таггау ; адрес первого элемента -> Е$51 
тоу ЕСХ. 1еп : размер массива -> ЕСХ 
иг ЕСХ. 2 скорректировать размер 
тоу ЕАХ, [Е5Г] ; поместить первый элемент массива в ЕАХ 
; и принять его в качестве максимума 


пех: 
стр ЕАХ. [Е51+4] ; сравнить со следующим элементом массива 
] спапде ; если ЕАХ меньше. заменить его 
90_Тоор: 
а44 ЕЗТ, 4 ; перейти к следующему элементу 
Тоор пех 
Заир ех1% 
спапде: 
тоу ЕАХ. [Е$1+4] 
р 90_100р 
ех1{: 
моу тах. ЕАХ 
]Леа ЕАХ. тахуа1 
геф 
_мах епдр 
епа 


Алгоритм поиска реализован следующим образом: 


1. В регистр ЕАХ помещается первый элемент массива 1аггау, который счита- 
ется первым максимумом. 


2. Содержимое регистра ЕАХ сравнивается со следующим элементом массива: 


» если значение в ЕАХ больше значения элемента массива, то выбирается 
следующий элемент для сравнения и цикл повторяется; 


*« если значение в ЕАХ меньше значения элемента массива, то в регистр по- 
мещается новый максимум. 


После окончания цикла полученное максимальное значение помещается в пе- 
ременную тахуа1, после чего адрес переменной передается в регистр ЕАХ. Процеду- 
ру легко модифицировать для поиска минимального элемента массива. Вот фраг- 
мент измененного кода (изменения выделены жирным шрифтом): 


пеж: 
стр ЕАХ, [Е$1+4] 
33 спапае 

90_1ообр: 

Последний пример, который мы рассмотрим, — вычисление сумм всех поло- 
жительных и отрицательных чисел, находящихся в массиве целых чисел. Сумма 
положительных чисел массива а1 сохраняется в 32-разрядной переменной $ит_р1из, 
а сумма отрицательных чисел помещается в переменную 5ит_ тпиз. Вычислитель- 
ный алгоритм реализован в процедуре _зит_р1из_т1пиз, исходный текст которой 
представлен в листинге 8.30. 
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Листинг 8.30. Вычисление сумм положительных и отрицательных элементов массива 
целых чисел (32-разрядная версия) 


.586 

„тоде] +1а+ 

орЁ1оп сазетар: попе 

„Чата 
а1 06 123, -96. -17. 403 
Теп ЕСУ $-а1 
гез Табе]? дога 


зит_р1и$ 000 
зит_пЧпиз 00 0 
„.соде 
_зит_р1из_пйпиз ргос 
тоу ЕСХ, 1еп :; помещаем размер массива а1 в регистр ЕСХ 


$иг ЕСХ. 2 ; корректируем счетчик для двойных слов 
Теа ЕВХ. а1 ; адрес массива а1 -> ЕВХ 
пех: 
хог ЕАХ. ЕАХ 
тоу ЕАХ, Омога рёг [ЕВХ] ; очередной операнд -> ЕАХ 
стр ЕАХ, 0 ; сравнить с нулем 
Л ри : если число больше 0, прибавить его 


$ к $иМ_р1и$ 
а94 зит_р1из, ЕАХ 
тр сот 1пие 
р1и$: 


адс зит_т4пиз, ЕАХ число меньше 0. прибавить его 


: К $ ППи$ 
соп1пие: 
а94 ЕВХ. 4 ; переход к следующему элементу массива 
Тоор пех ; следующая итерация 
1еа ЕАХ, гез ; адрес результата -> ЕАХ 
ге 
_зит_рТиз_пйпиз$ епар 
епа 


Заканчивая обзор операций целочисленной арифметики, можно сделать неко- 
торые выводы: 


» Во всех операциях лучше всего использовать операнды большей размерно- 
сти, даже если исходные значения укладываются в переменные меньшей 
размерности. Результат операции может превысить размерность операн- 
дов, что вызовет ошибки переполнения. 


® По возможности следует выполнять операции над однотипными операнда- 
ми (байт-байт, слово-слово и т. д.). Это позволит избежать необходимости 
преобразования типов с помощью команд сЬи, си, сдд, поузх, тоу2х, которые 
отнимают часть процессорного времени и замедляют работу программы 
в целом. Если такие преобразования выполняются в цикле, состоящем из 
десятков тысяч итераций, то замедление может оказаться существенным. 


Если нужно выполнять умножение или деление на числа, кратные 2, то лучше 
использовать для этой цели команды логического и арифметического сдвига. Это 
дает существенный выигрыш в скорости. 


Использование 
математического 
сопроцессора 





До сих пор мы рассматривали выполнение арифметических операций над цело- 
численными значениями с помощью базовых команд процессора пие! Реп{ит, 
таких, как а44, 5/6, ти], Ч1у и т. д. В самом процессоре эти операции выполняют мо- 
дули целочисленных операций. В то же время большая часть вычислений требует 
использования вещественных чисел или, как принято говорить, чисел с плавающей 
точкой. Операции над числами с плавающей точкой можно также выполнять при 
помощи команд целочисленной арифметики, создавая специальные алгоритмы. 

Однако намного проще и эффективнее использовать для этих целей матема- 
тический сопроцессор, или просто сопроцессор. Для создания вычислительных 
алгоритмов обработки чисел с плавающей точкой необходимо достаточно хоро- 
шо знать систему команд и особенности работы сопроцессора или, как его еще 
называют, модуля операций с плавающей точкой (Е1\оайпЕ Роше Опи, ЕРО) про- 
цессоров Гёе|. 

Сопроцессор обрабатывает команды с плавающей точкой, отслеживая коман- 
ды процессора и работая параллельно с ним (рис. 9.1). 


Декодер команд (1пзгисвоп Оесодег) 


. 
зозово нос ово ваваное 
. . 
























Модуль операций 
с плавающей 
точкой (Роайпа 
Рот! ЦпИ) 


Модуль 
целочисленных 
операций 
(имедег Упй) 


Шина данных (Оба! Биз) 
Рис. 9.1. Взаимодействие модуля целочисленной обработки и ЕРЦЫ 
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Параллельная работа процессора и сопроцессора повышает производитель- 
ность выполнения программ в целом. Сопроцессор расширяет математические 
возможности основного процессора, но не замещает ни одну из его команд. Ос- 
новные арифметические команды, такие, как а, зи, ти], @1\, и другие, выполня- 
ются процессором, а математический сопроцессор выполняет дополнительные 
более эффективные команды арифметической обработки. С точки зрения про- 
граммиста, система с математическим сопроцессором выглядит как единый про- 
цессор с расширенным набором команд. 

В этой главе основное внимание уделено практическим аспектам работы сопро- 
цессора и использованию его возможностей при разработке программ. Полное 
описание сопроцессора могло бы занять отдельную книгу, поэтому рассмотрены 
наиболее важные моменты в функционировании этого модуля. Теоретические 
основы построения сопроцессора, а также принципы представления данных бо- 
лее подробно описаны в фирменных руководствах [пе], к которым можно обра- 
титься для более глубокого изучения темы. 

Материал главы снабжен многочисленными примерами подпрограмм на ас- 
семблере, которые могут использоваться как в других ассемблерных програм- 
мах, так и в программах на языках высокого уровня. Все подпрограммы предна- 
значены для обработки 32-разрядных данных. Для проверки результатов работы 
подпрограмм на ассемблере можно использовать простейшие программы на 
\У15иа] С++ МЕТ, хотя без каких-либо ограничений подойдут и более ранние вер- 
сии компиляторов, например \У1зца! С++ версии 6. 

Я сознательно не задействую для просмотра результатов работы процедур 
отладчики, поскольку это отнимает много времени, а сам результат далеко не 
очевиден и нуждается в дополнительной интерпретации. К тому же это требует 
хороших навыков в отладке программ, что вызывает дополнительные трудности. 

Знакомство с работой математического сопроцессора начнем с обзора типов 
данных, которые сопроцессор может обрабатывать. 


9.1. Типы данных сопроцессора 


Математический сопроцессор расширяет номенклатуру форматов данных, с ко- 
торыми работает основной процессор. К таким форматам относятся: 


» целые двоичные числа разрядности 16, 32 и 64 бит; 
® упакованные целые десятичные (ВСО) числа размером до 9 байт; 


» вещественные числа в коротком (32 бита), длинном (64 бита) и расширен- 
ном (80 бит) форматах. 


Помимо этих форматов поддерживаются и специальные числовые значения, 
к которым относятся: 


» денормализованные вещественные числа; 

® нуль; 

® положительные и отрицательные значения бесконечности; 

® нечисла; 

® различного рода неопределенности и неподдерживаемые форматы. 
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Сопроцессор имеет единое внутреннее представление данных и хранит все 
числа в едином 80-разрядном расширенном формате. Это один из форматов 
представления вещественных чисел, который в точности соответствует формату 
регистров стека сопроцессора. Любые операнды, представленные в виде 16-, 32- 
и 64-разрядных целых чисел, 32-, 64- или 80-разрядных чисел с плавающей точ- 
кой, а также упакованных ВСО-чисел, представленных 18 цифрами, при загрузке 
в регистры сопроцессора автоматически переводятся в расширенный формат. 
Результаты вычислений переводятся обратно в один из этих форматов данных 
и сохраняются в регистрах или памяти. 

Рассмотрим более детально типы данных сопроцессора и начнем с двоичных 
чисел. Они могут иметь один из трех форматов: 


» целое число размером 16 бит, диапазон значений от —32768 до +32767; 


» короткое целое число размером 32 бит, диапазон значений от —2 х 10° 
до +2 х 10°; 


» длинное целое число размером 64 бит, диапазон значений от -9 х 1018 
до +9 х 1018. 


При выборе формата необходимо учитывать, что, хотя сопроцессор и поддер- 
живает целочисленные форматы, операции с ними выполняются недостаточно 
эффективно. Причина этого кроется в том, что все целочисленные данные пере- 
водятся в расширенный формат вещественного числа (внутреннее представление 
чисел в сопроцессоре), что требует дополнительных операций преобразования. 

Числа в упакованном десятичном формате представлены в сопроцессоре в фор- 
мате «9 байт + бит знака» (рис. 9.2). 


Старшие биты Младшие биты 
$Фф————— 
79 71 64 7 0 


ЕН 


Знак 9-й байт 8-й байт 0-й байт 
Рис. 9.2. Представление десятичного числа в сопроцессоре 


Должен заметить, что сопроцессор включает только две команды для работы 
с упакованными десятичными числами. 

Что же касается вещественных чисел, то они могут иметь размерность 32, 64 
или 80 бит. Мы не будем подробно рассматривать способы внутреннего представ- 
ления вещественных чисел в сопроцессоре, поскольку на практике это не имеет 
особого значения. | 

Диапазоны представления чисел в сопроцессоре следующие: 


» короткое (32-разрядное) вещественное число — от 10-38 до 10*38; 
» длинное вещественное число — от 10-368 до 10*308; 
® расширенное вещественное число — от 10-4332 до 10*4932, 


Ассемблерные программы чаще всего используют 32-разрядные веществен- 
ные числа. Для таких чисел обычной формой представления является двойное 
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слово, объявленное с директивой 00 ассемблера. Длинные вещественные числа 
размерностью в 64 разряда могут быть представлены в виде учетверенного слова 
(директива 00). 

Специальные числовые или нечисловые значения могут получаться в резуль- 
тате выполнения математических операций сопроцессором. Например, к не-чис- 
лам (Моп-А-Митьег, МАМ) относятся последовательности битов, которые нельзя 
сопоставить ни с одним форматом. К специальным числовым значениям относят 
ноль и бесконечность. Значение «ноль» может, например, быть результатом рабо- 
ты команд с нулевыми операндами. В перечень специальных числовых значе- 
ний входят и так называемые денормализованные числа. Это числа, выходящие 
за пределы диапазона данного формата и приближающиеся к нулю. 


9.2. Архитектура сопроцессора 


Программная модель сопроцессора представляет собой набор дополнительных 
регистров, типов данных и команд. В группу регистров сопроцессора входят: 


® восемь отдельно адресуемых 80-разрядных регистров, организованных в виде 
регистрового стека; 


» три служебных 16-разрядных регистра: регистр состояния мг (З4аби$ У/ог4 
Кезцег) сопроцессора, управляющий регистр сиг (Сопёго| \Уога Кер$ег) 
и регистр тегов {мг (Таз \!ог4 Кезлзкег); 


® регистры-указатели данных арг (Баба Роше Кезчег) и команд 1рг (шягис- 
Ноп Роше Кеззег) используются при обработке исключительных ситуаций. 


Все регистры доступны для программ с помощью специальных команд сопроцес- 
сора. Инструкции для обработки чисел с плавающей точкой тем или иным спосо- 
бом используют содержимое этих регистров. Рассмотрим более подробно регистры 
сопроцессора и начнем с регистрового стека. Его структура показана на рис. 9.3. 


Знак Порядок Мантисса Регистр тегов 
79 78 64 63 0 1 0 
[5$] >» 1—0 
К1 >» 3—2 
В2 +» 5—4 
ВЗ + 7—6 
в4 +» 9—8 
&5 + 11 — 10 
В6 + 13— 12 
7 +» 15 — 14 


Рис. 9.3. Регистровый стек сопроцессора 


Каждый из восьми числовых регистров в стеке имеет размер 80 бит и состоит 
из отдельных полей, в соответствии с расширенным вещественным типом данных. 
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Команды сопроцессора адресуют регистры данных относительно регистра, являю- 
щегося вершиной стека. В любой момент времени номер этого регистра содер- 
жится в поле фор регистра состояния (5мг) сопроцессора. 

Подобная организация стека и выбранный метод адресации (относительно 
вершины стека числовых регистров) упрощает программирование сопроцессора, 
поскольку позволяет подпрограммам передавать параметры через регистровый 
стек. Любая программа, выполняющая вычисления, может-загрузить параметры 
в стек, после чего к ним можно получить доступ через логические имена регист- 
ров стека ($4(0), $%(1), $%(2) ит. д.). 

Регистр состояния (5мг) содержит информацию о текущем состоянии сопроцес- 
сора. Некоторые наиболее важные для:разработчика поля показаны на рис. 9.4: 


Заиз М/ога Ред ег ($\иг) 


15 14 13 12 11 10 9 87 0 





юр 
Рис. 9.4, Регистр состояния ($\г) сопроцессора 


Поля с3-с0 регистра устанавливаются определенным образом после выпол- 
нения математических операций и являются аналогом флагов в регистре флагов 
ЕРЬАб$ основного процессора. Поля 13-11 содержат текущий номер регистра сте- 
ка (К0-К7), являющийся в данный момент вершиной стека. 

Слово состояния регистра мг можно сохранить в памяти с помощью команд 
151 5м/Рп$Е 5, Гфепу/Ризфепу и Рзауе/Рпзауе, после чего передать его в регистр АХ 
с помощью команд 15&5м АХ/Рп$ф5м АХ, позволяя программе проверить слово со- 
стояния сопроцессора. Команда зай? может копировать поля с3-с0 непосредст- 
венно в биты флагов процессора, что упрощает организацию ветвлений и услов- 
ных переходов в программах. 

Рассмотрим функционирование стека сопроцессора. Команды сопроцессора 
не обращаются напрямую к регистрам К0-КУ, а используют так называемые ло- 
гические номера регистров, имеющие обозначение $1(0)—51(7). Регистровый стек 
имеет кольцевую организацию, а это означает, что вершина стека является пла- 
вающей и на нее указывает логический регистр $1(0). Функционирование стека 
демонстрируют рис. 9.5 — 9.7. На рис. 9.5 показано состояние стека, когда регистр 
В5 является вершиной стека. 

Операции загрузки данных в стек уменьшают значение фор на единицу и за- 
гружают данные из памяти в новую вершину стека. Операции сохранения и вос- 
становления данных из стека сохраняют значение из регистра, являющегося вер- 
шиной стека, в оперативную память, после чего увеличивают фор на единицу. 
Подобно стеку основного процессора в памяти, регистровый стек сопроцессора 
растет вниз по направлению к регистрам с меньшими адресами. Если стек сопро- 
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цессора находится в состоянии, показанном на рис. 9.5, то при загрузке очередно- 
го числа вершина стека переместится к регистру ВА (рис. 9.6). 


Стек сопроцессора 


Физический 

номер 

регистра 

$3) 
$4) 
$5) 
36) 
(7) 
$0) <=— юр 
$41) 
$42) 


Заш$ М/ога Кедг$!ег ($м/г) 


15 14 13 12 11 10 987 





Рис. 9.5. Состояние стека, если вершина находится в физическом регистре К5 


Стек сопроцессора 
Физический 


$4) 
$К5) 
56) 
$(7) 
$40) <=— ®р 
$41) 
(2) 
$3) 


Заш$ М/ога Ред$!ег ($\т) 


15 14 13 12 11 10 987 





Рис. 9.6. Состояние стека при перемещении вершины стека в регистр В4 
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В этом случае биты 13-11 регистра состояния устанавливаются в значение, 
равное 4, как видно на рис. 9.6. Если теперь из стека сопроцессора удалить два 
числа, то вершина стека переместится к регистру Кб, как показано на рис. 9.7. 


Стек сопроцессора 
Физический 
номер 
регистра 
$42) 
$3) 
$4) 
$(5) 
$6) 
$47) 
$0) <=— юр 
$1) 


Заз М/ога Кед ег ($\/г) 


15 14 13 12 11 10 987 





Рис. 9.7. Состояние стека при перемещении вершины стека в регистр Кб 


Соответствующие биты регистра состояния будут отображать состояние вер- 
шины стека и указывать номер регистра, являющегося вершиной стека (В6б). 

Для установки режимов обработки данных сопроцессора служит регистр управ- 
ления (сиг). Он включает в себя шесть масок исключений, поля управления точно- 
стью (ргес11юп сопёго|, ре) и поля управления округлением (гоипд 18 сопёго|, ге). 
Формат регистра управления показан на рис. 9.8. 

Вначале проанализируем смысл поля ре. С помощью битов этого поля выби- 
рается длина мантиссы: 


» 00 — длина мантиссы равна 24 бит; 
® 10 — длина мантиссы равна 53 бит; 
® 11 длина мантиссы равна 64 бит. 


Далее показаны возможные комбинации поля гс и соответствующие им режи- 
мы округления: 


®е 00 — число, содержащееся в стеке $1(0) сопроцессора, округляется до бли- 
жайщего целого значения. Например, если требуется округлить число 3,14, 
то полученный результат равен 3. Если нужно округлить число 4,67, то по- 
лученный результат равен 5; 
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Регистр управления смг 


15 12 11 10 9 87 65432 то 









Отрицательное переполнение 
Переполнение 
Деление на 0 





Ненормализоаанный операнд 
Недопустимая операция 


Рис. 9.8. Формат регистра управления смг 


® 01 — число в $%(0) округляется в меньшую сторону. В этом случае для 
только что рассмотренных чисел (3,14 и 4,67) их округленные значения 
были бы равны 3 и 4 соответственно; 


® 10— число в $1(0) округляется в большую сторону. В этом случае для толь- 
ко что рассмотренных чисел (3,14 и 4,67) их округленные значения были 
бы равны 4 и 5 соответственно; 


®е 11 — отбрасывается дробная часть числа. В этом случае число 3,14 округля- 
ется до 3, а 4,67 — до 4. 


Шесть масок предназначены для маскирования исключительных ситуаций, 
возникновение которых фиксируется в регистре состояния. Если какие-то биты 
исключений в регистре сиг установлены в 1, это означает, что соответствующие 
исключения будут обрабатываться математическим сопроцессором. Если для ка- 
кого-то типа исключения соответствующий бит маски сиг установлен в 1, то при 
возникновении исключения возбуждается прерывание. Обработчик прерывания 
должен либо находиться в самой операционной системе, либо разрабатываться 
программистом. 

Когда сопроцессор обнаруживает ошибку, он пытается возбудить прерывание 
по особой ситуации, устанавливая соответствующие биты в слове состояния. Од- 
нако если ситуация замаскирована с помощью управляющего слова, сопроцессор 
сам реагирует на нее. Он решает, какая реакция соответствует данной ошибке, 
и возбуждает появление специфического числа в регистре. Например, результат 
МАМ возникает, если операция некорректна, как в случае извлечения квадратно- 
го корня из отрицательного числа. Бесконечность появляется, если результат 
операции слишком велик для представления с плавающей точкой. 

Биты управления точностью (биты 8-9) могут быть использованы для того, 
чтобы установить меньшую точность внутренних операций устройства, чем точ- 
ность, заданная по умолчанию (размер мантиссы равен 64 бита). Биты управ- 
ления точностью действуют только на результаты следующих арифметических 
операций: а09, иб, ти1, Ч1\ и $4гё. Никакие другие операции зтими битами не 
управляются. 
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Биты управления округлением (биты 10-11) предоставляют обычный режим 
округления до ближайшего целого, а также непосредственное округление и отсече- 
ние. Биты управления округлением действуют только на арифметические операции. 

Рассмотрим еще один регистр сопроцессора — регистр тегов (+мг). Этот ре- 
гистр представляет собой совокупность двухразрядных полей. Каждое из этих 
полей соответствует определенному физическому регистру стека (см. рис. 9.2) 
и является индикатором состояния этого регистра. Если состояние одного из фи- 
зических регистров К0-В7 изменяется, то это немедленно отражается на соответ- 
ствующем этому регистру поле регистра тегов. Поле в регистре тегов может при- 
нимать одно из следующих значений: 


® 00 — регистр стека сопроцессора содержит допустимое ненулевое значение; 
® 01 — регистр стека сопроцессора содержит нулевое значение; 


® 10 — регистр стека сопроцессора содержит одно из специальных числен- 
ных значений (кроме нуля); 


® 11— регистр стека является пустым и допускает запись данных. 


Если пытаться анализировать регистр тегов, то нужно принимать во внимание 
тот факт, что данные полей отображают состояние физических регистров В0-В7, 
а не логических $1(0) — $1(7). Для получения полной информации о состоянии ре- 
гистров стека потребуется использовать поле фор регистра состояния ($мг). 


9.3. Система команд математического 
сопроцессора 


Команды с плавающей точкой можно сгруппировать в 5 функциональных классов: 
® команды передачи данных; 
® команды сравнения; 
® трансцендентные команды; 
® команды манипуляций константами; 
®» управляющие команды. 


Обычно команда с плавающей точкой имеет один или два операнда, которые 
выбираются из регистрового стека сопроцессора или из памяти. Многие коман- 
ды, такие, например, как 511, по умолчанию работают с операндом в вершине ре- 
гистрового стека. Другие команды требуют явной кодировки операнда или опе- 
рандов в соответствии с мнемоникой операции. Существует еще один формат 
команд, принимающий один явный и один неявный операнд (обычно элемент 
в вершине стека). 

Вне зависимости от того, определены операнды команд-с плавающей точ- 
кой явно или принимаются по умолчанию, они делятся на два основных типа: 
операнд-источник и операнд-приемник. Даже когда команда преобразует опе- 
ранд-источник из одного формата в другой (например, вещественное число в целое), 
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она работает во внутренней области, чтобы предотвратить изменение исходного 
операнда. 

Многие команды позволяют кодировать операнды различными способами. 
Например, команда {а44 (сложение чисел с плавающей точкой) может быть исполь- 
зована либо без операндов, либо только с операндом-источником, либо с операн- 
дом-источником и операндом-приемником. Когда указаны оба операнда, то опе- 
ранд-приемник должен предшествовать операнду-источнику в командной строке 
и оба должны быть взяты из регистрового стека сопроцессора. Команды, обраба- 
тывающие данные с плавающей точкой, либо выполняют чтение из памяти, либо 
сохраняют данные в памяти. При этом ни одна из этих команд не делает то и дру- 
гое одновременно. 

Перейдем теперь к анализу отдельных групп команд и начнем с команд пере- 
дачи данных. 

Команды передачи данных передают данные между регистрами стека и памя- 
тью. Эти команды можно разделить на три группы: 


® команды передачи чисел с плавающей точкой; 
® команды передачи целых чисел; 
е команды передачи десятичных чисел. 


Команды передачи данных автоматически обновляют регистр состояния сопро- 
цессора. Рассмотрим команды передачи данных в формате вещественных чисел: 


® ГО операнд-источник — загружает вещественное число из ячейки памяти, 
представленной операндом-источником, в вершину стека сопроцессора; 


® 151 операнд-приемник, 1${р операнд-приемник — обе команды сохраняют ве- 
щественное число из вершины стека в памяти. Единственное различие двух 
команд состоит в том, что команда {51р еще выталкивает операнд из стека, 
увеличивая тем самым значение вор на 1. В этом случае вершиной стека 
становится физический регистр с большим номером. 


Для передачи целочисленных данных используются следующие команды: 


® 1114 операнд-источник — загружает число из ячейки памяти, представлен- 
ной операндом-источником, в вершину стека; 


® [151 операнд-приемник, 115Ёр операнд-приемник — обе команды сохраняют 
целое число из вершины стека в памяти. Единственное различие двух ко- 
манд состоит в том, что команда 115%р еще выталкивает операнд из стека, 
увеличивая тем самым значение (юр на 1. В этом случае вершиной стека 
становится физический регистр с большим номером. 


Команды передачи данных, представленных в десятичном формате: 


® 1014 операнд-источник — загружает число из ячейки памяти, представлен- 
ной операндом-источником, в вершину стека; 


® Г65{роперанд-приемник — сохраняет целое число из вершины стека в памя- 
ти и выталкивает операнд из стека, увеличивая тем самым значение бор на 1. 
В этом случае вершиной стека становится физический регистр с большим 
номером. 





216 


Глава 9 » Использование математического сопроцессора 


К командам передачи можно отнести и группу команд для загрузки в стек ре- 
гистров предопределенных констант: 


{192 — поместить 0 в вершину сопроцессора; - 
7191 — загрузка единицы в вершину стека сопроцессора; 
191 — загрузка числа л в вершину стека сопроцессора; 


79124 — загрузка двоичного логарифма десяти в вершину стека сопроцес- 
сора; 
11 912е — загрузка двоичного логарифма числа е в вершину стека сопроцес- 
сора; 
#19192 — загрузка десятичного логарифма двух в вершину стека сопроцес- 
сора; 


12 — загрузка натурального логарифма двух в вершину стека сопроцес- 
сора. 


Существует еще одна команда, которую можно отнести к группе команд пе- 
редачи данных, — это команда Тхсй ${(1). Команда позволяет обменять значения 
в вершине стека сопроцессора и регистра ${(1). Работу команд мы будем иллюст- 
рировать примерами в виде 32-разрядных пропелур, возвращающих результат 
в регистре ЕАХ. 

Перед использованием любых команд математического сопроцессора необхо- 
димо выполнить его инициализацию командой 111+. Алгоритм работы команды 
выглядит следующим образом: 


1. 


2. 


5. 


6. 


В регистр управления (сиг) помещается число 371, означающее, что округ- 
ление будет выполняться до ближайшего целого (поле гс = 0). 

Биты с нулевого по пятый устанавливаются в 1, что означает маскирование 
всех исключений. . 

Поле управления точностью устанавливается для работы с максимальной 
точностью в 64 бит (ре = 11). 

Регистр состояния (5мг) обнуляется, а это означает, что исключения отсут- 


ствуют и физический регистр КО регистрового стека становится вершиной 
стека $%(0). 


В регистр тегов (+мг) заносятся единицы, а это означает, что все регистры 
сопроцессора считаются пустыми. | 


Регистры указателей данных (4рг) и команд (1рг) обнуляются. 


Все вышеизложенное относится ко всем примерам этой главы, а начнем мы 
с копирования чисел с плавающей точкой (листинг 9.1). 


Листинг 9.1. Копирование чисел с плавающей точкой 


.686 


люде] 11аф 
ороп сазетар: попе 


„Чата 


$гс 00 13.49, -71.01. -8.15. 33.39. 765.11 
1еп ЕСИ $-$гс 


9$ 00 1Теп 0Р(0) 
‚сое 
поуе_ТТоаф ргос 
Ни 
моу ЕСХ. 1еп 
эй" ЕСХ. 2 
1еа ЕЗГ. $гс 
Теа ЕОГ. 45% 
пехс: 
"а дога рег [ЕЗГ] 
Т5фр Фмога рёг [ЕО] 


949 ЕЗГ. 4 
а44 Е01. & 
ес ЕСХ 
372 пех 


Теа ЕАХ. 95% 

ге 
поуе_ТТоаф епар 
епа 
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; количество байтов массива $гс -> ЕСХ 

; привести к размерности двойного слова 
: адрес массива $гс -> ЕЗ1 
; адрес нассива 4$& -> ЕТ 


; поместить в вершину стека элемент массива $гс 
; поместить в массив 4$ элемент 

; из вершины стека 
; перейти к следующему элементу в $гс 
: перейти к следующему элементу в 95% 
: декремент счетчика 

; если не равен 0. перейти 
: К следующей итерации 

: вернуть в регистре ЕАХ адрес нассива 454 
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Процедура тоуе_11оа* выполняет копирование элементов массива $гс чисел 
с плавающей точкой в массив 45+. Собственно копирование чисел выполняется 
командами 119 и 15+р. Обе команды оставляют вершину стека в том же состоянии, 
что и до вызова этих команд. 
Процедура заполнения массива определенным значением показана в листинге 9.2 


Листинг 9.2. Заполнение массива определенным значением 


.686 
„тоае] Наф 
орё1оп сазетар: попе 
„Чата 
$гс 00 37 ОР (?) 
1еп ЕЦ $-$гс 


уа1 00 1.45 

.соде 

зеё_уа1ие ргос 
Ни 
оу ЕСХ, 1еп 
Аг ЕСХ. 2 
1еа ЕЗГ, $гс 


+19 @мога рёг уа1 
пехё: 
15 дога рёг ГЕЗГ 
ава ЕЗТ. 4 
дес ЕСХ 
72 пеж 
1ис$Ер 
Теа ЕАХ. $гс 
ге 
зе уа1ие епар 
епа 
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Процедура зе _уа1ие выполняет заполнение массива $гс, содержащего 37 эле- 
ментов, значением \уа1, равным 1,45. Вначале значение уа1 помещается в вершину 
стека с помощью команды 


#19 дмог@ рёг уа1 


После этого в цикле выполняется копирование этой величины в элементы 
массива при помощи команды 


156 дога р" [ЕП 


Обратите внимание на то, что значение уа1 не выталкивается из вершины сте- 
ка до тех пор, пока цикл не закончится. После завершения всех итераций верши- 
на стека очищается командой 1 1пс$ёр. Эта команда действует подобно команде 
Е5%р с той лишь разницей, что число выталкивается из стека в «никуда». Указа- 
тель вершины стека в поле бор регистра $мг после выполнения этой команды уве- 
личивается на 1. Процедура возвращает адрес массива $гс в регистре ЕАХ. 

Листинг 9.3 демонстрирует, как выполняется команда Ёхсй и функционирует 
стек регистров (процедура РхсИ_дето). 


Листинг 9.3. Демонстрация использования регистров стека 


.686 

.тоде] Г а* 

ор1оп саземар: попе 

.Чафа 

тмето Табе] дмога 

метю1 009.18 ; первое число 

тето? 00 1.05 ; второе число 

.соде 

Фхсп_аето ргос 
#1116 
74 пето1 ; поместить эначение переменной 

; метою] в стек 

#4 тетю? ; поместить тетю? в стек 
фхси $%(1) ; обменять эначения в $%(0) и $(1) 
{$р тмето2 ; сохранить содержимое вершины стека в тето2 
1$&р тетю? ; сохранить содержимое вершины стека в метю1 
1еа ЕАХ. мето ; вернуть адрес области памяти в регистре ЕАХ 
га 

Тхсп_дето епар 

епа 


Проанализируем работу процедуры РхсН_дето. Пример может показаться до- 
статочно сложным, поэтому для иллюстрации всех операций будем пользоваться 
рисунками. После выполнения следующей команды вершина стека будет содер- 
жать значение 9,18, как показано на рис. 9.9: 


9 пето? 


Следующая команда, 114 тето2, загружает в стек регистров значение тето2. При 
этом вершина стека перемещается к физическому регистру с меньшим адресом 
и содержит значение 1,05. Значение переменной птето1, равное 9,18, перемещается 
в регистр $*(1). Все это показано на рис. 9.10. 
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Стек сопроцессора 


:] $60) — Вершина стека (юр) 





Рис. 9.9. Содержимое вершины стека после выполнения команды Яд тето1 


Стек сопроцессора 





Рис. 9.10. Содержимое вершины стека после выполнения команды Яд тето2 


После выполнения следующей команды регистры $#(0) и $1(1) меняются со- 
держимым (рис. 9.11): 


Тхси $(1) 


Стек сопроцессора 





Рис. 9.11. Содержимое стека после выполнения команды ЁхсН $1) 


Теперь остается сохранить содержимое стека в памяти. Первая команда, 
Т5&р метоё, сохраняет содержимое вершины стека в переменной пето2, при этом 
указатель вершины стека становится на 1 меньше (рис. 9.12). 
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Стек сопроцессора 


| $60) <=— Вершина стека ((ор) 





Рис. 9.12. Содержимое стека после выполнения команды #5 тето2 


Наконец, после выполнения команды 5р тето] содержимое стека (значе- 
ние 1,05) помещается в переменную пето1. Таким образом происходит обмен 
значениями переменных пето] и тело2. При этом стек регистров сопроцессора 
очищается. - 

Следующая группа команд, которую мы рассмотрим, — команды сравнения. 
Эти команды выполняют сравнение содержимого вершины стека с указанным 
в команде операндом. К этой группе относятся следующие команды: 


® Гсот — сравнение содержимого вершины стека $%1(0) с содержимым регист- 
ра $%{1); 

® Гсотр пет — выполняет сравнение содержимого вершины стека $1(0) с опе- 
рандом памяти пет, после чего выталкивает число из $1(0) и увеличивает 
указатель вершины стека на 1 в поле &юр регистра $мг. Операнд тет может 
быть 32- или 64-разрядным числом с плавающей точкой; 


® Гсотрр — выполняется так же, как и Гсом, только обеспечивает выталкивание 
из стека значений, находящихся в регистрах $+(0) и $1(1); 


® Г1соп — сравнение целочисленных значений $1(0) и $1(1); 


® сотр пеп — выполняет сравнение содержимого вершины стека $1(0) и опе- 
ранда памяти мет, после чего выталкивает число из $%(0) и увеличивает 
указатель вершины стека на 1 в поле фор регистра 5мг. Операнд тет может 
быть 16- или 32-разрядным целым; 


® (151 — сравнение содержимого вершины стека $1(0) с нулем; 


® Гхат — выполняет анализ операнда, находящегося в вершине стека сопро- 
цессора и по результату такого анализа устанавливает биты с0—с3 специ- 
альным образом. 


Команды сравнения дают правильный результат в тех случаях, когда операн- 
ды являются целыми числами или числами с плавающей точкой. Если только 
один из операндов является нечислом (МАМ), то возбуждается исключительная 
ситуация и операция сравнения не производится. 

Команды сравнения устанавливают биты кода условия в регистре $мг, как по- 
казано в табл. 9.1. 
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Таблица 9.1. Коды условия команды от 


сз .  ©2 


©1 


эъоъэз>ъ 


с0 Значение 

0 $(0) больше операнда 

1 $(0) меньше операнда 

0 $((0) равен операнду 

1 $((0) и операнд несравнимы 


Манипулировать непосредственно битами кода условия с3—с0 не совсем удоб- 
но. Существует`другой механизм, с помощью которого можно определить резуль- 
тат сравнения привычным способом, используя битовые флаги регистра флагов 
процессора. Для этих целей в состав системы команд сопроцессора включена 
команда #515, позволяющая сохранить слово состояния в регистре АХ или в ячей- 
ке памяти. Интересующие нас биты легко могут быть извлечены с помощью 
команды зан, которая записывает содержимое регистра АН в младший байт ре- 


гистра флагов. 


При этом бит с0 помещается на место флага СЕ, с2 — на место флага РЕ, с3 — 
на место 72, а бит с1 не используется. Рассмотрим несколько примеров выполне- 
ния команд сравнения, начав с поиска большего из двух чисел (листинг 9.4). 


Листинг 9.4. Поиск большего из двух чисел 


.686 
.пюде] Е1а+ 


орЁ1оп сазетар: попе 


‚дата 

а1 00 -162.31 
а2 00 -117.03 
гез 00 0 

.соде 

мах ргос 
11115 


#9 —0мога рёг а1 
#19 дога рёг а2 


сот 
15%5м АХ 
запт 
лс $ оге 
Тхсп $%(1) 
$$0ге: 
Ур гез 
мат 
1еа ЕАХ. гез 
ге 
мах епар 
ета 


Процедура пах, исходный текст которой приведен в листинге 9.4, сравнивает 
два числа с плавающей точкой и в качестве результата в регистре ЕАХ возвращает 
значение большего из них. Вначале в стек регистров сопроцессора загружается 
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первое число, затем — второе. Для сравнения двух чисел используется команда 
Тсот без параметров, предполагающая наличие операндов в стеке. К моменту 
выполнения команды Тсот в вершине стека находится число а2, в то время как 
число а1 находится в регистре $%(1). 

После сравнения флаги сохраняются в регистре АХ с помощью команды 1515 АХ, 
а следующая команда, зай, извлекает их в регистр флагов ЕРЕАб5. Здесь следует 
быть очень внимательным. Для анализа результата сравнения можно использо- 
вать три значащих флага: 


» (СР соответствует биту с0; 
» 7-Е — соответствует биту с3; 
® РЕ соответствует биту ©2. 


Различным комбинациям этих флагов соответствуют различные команды 
условного перехода. Например, условием того, что операнд в регистре $*{0) больше 
операнда в ${(1), является равенство нулю флага переноса (СЕ = 0). В этом случае 
для ветвления программы можно использовать команду пс $оге, при этом число 
в вершине стека является максимумом и сохраняется в переменной гез. В про- 
тивном случае регистры $%(0) и ${(1) меняются операндами и в вершине стека 
оказывается большее число, которое и сохраняется в переменной гез. 

Возможен и другой вариант — использовать мнемонически более понятную 
команду а боге. Эта команда анализирует флаг (Е на равенство нулю, поэтому 
фрагмент кода, где присутствует команда дпс, можно переписать следующим об- 
разом: | 

Тсот 

1$15м АХ 
зай 
4а $боге 


Рхсй $%(1) 
$4оге; 


При указанных значениях операндов переменная гез будет содержать значе- 
ние, равное —117,03. 

В листинге 9.5 показана процедура сравнения массивов, содержащих числа 
с плавающей точкой. 


Листинг 9.5. Сравнение массивов, содержащих числа с плавающей точкой 


. 686 

„тоде] Раф 
ороп сазетар: попе 

дата 

а1 00 -117.03. 8.04, -9.21. 5.16 
а2 00 -117.03. 8.04, -9.21. 5.16 
1Теп ЕСУ $-а2 

едиа1$ ОВ "Аггауз аге едиа!!". 0 
поп_ед ОВ "Аггауз аге поф едиа1!”,0 
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.соде 

аггауз_еа ргос 
Леа  ЕЗГ. а! 
Теа  ЕОГ, а2 
оу  ЕСХ. 1еп 
иг ЕСХ. 2 
111% 

пехс: 


7  90гд рек [ЕЗП 
719 дюгд рёг [Е0Г] 


сот 
1515 АХ 
зай! 
ле те 
а49  ЕЗГ. 4 
а99 ЕТ. 4 
дес ЕСХ 
72 пех 
1еа  ЕАХ. ециа1$ 
др ех\ 
п_ед: 
Теа  ЕАХ. поп ед 
ех1{: 
Рае 
ге 
аггауз_еа епар 
епд 


Процедура аггау$_е4 в этом примере сравнивает два массива (а1 иа2) чисел 
с плавающей точкой одинакового размера. В случае равенства массивов в регист- 
ре ЕАХ возвращается строка едиа1$, в случае неравенства — строка п_ед. Перед на- 
чалом операции в регистры Е$1 и ЕО! загружаются адреса массивов а1 и а2, а в ре- 
гистр ЕСХ — размер массивов а] и а2. Элементы массивов загружаются в вершину 
стека сопроцессора с помощью команд 114, после чего выполняется операция 
сравнения элементов командой Гсоп. 

Как и в предыдущем примере, для обработки результата сравнения выполня- 
ются команды: 

1515 АХ 

зай 

ле пед 

Равенство или неравенство элементов определяется флагом 2Е, поэтому ис- 
пользуется команда те. Если до окончания цикла сравнения какие-либо элемен- 
ты оказываются неравными, то происходит выход из цикла по команде дпе п_е4. 

В группу команд сравнения включена очень полезная команда — 145%, по- 
зволяющая сравнить содержимое вершины стека $1(0) с нулем. Следующий 
пример демонстрирует применение этой команды. Процедура $0г{_гего ищет 
в целочисленном массиве а! чисел с плавающей точкой ненулевые элементы 
и сохраняет их в другом массиве — а2. Исходный текст процедуры показан в ли- 
стинге 9.6. 
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Листинг 9.6. Поиск ненулевых элементов массива чисел с плавающей точкой 


.686 
„тоде] Раф 
ор оп сазетар: попе 
дата 
а1 00 -17.03. 0. 9.21. 0. -67.3 
1еп ЕДУ $-а1 
а2 00 5 0ЩР (0) 
.соде 
$0гё_2его ргос 
]1еа  ЕЗГ. а1 
]1еа  ЕОГ. а2 
моу  ЕСХ. 1еп 
иг  ЕСХ. 2 
1111 
пех: 
ПО дога рег [Е5П 
ия 
15%5м АХ 
зай! 
де $К1р 
Тр дога рег [Е0Г] 
а04 ЕОГ. 4 
$К1р: 
а998  ЕЗГ. 4 
дес  ЕСХ 
д72  пеж 
Рима 
]1еа  ЕАХ. а2 
ге 
ог _тего епар 
епд 


Программный код процедуры $0Г{_2его во многом напоминает предыдущие 
примеры, поэтому остановлюсь лишь на основных различиях. Следующая группа 
команд анализирует содержимое вершины стека на равенство нулю (72 = 1) и либо 
пропускает такой элемент, если он нулевой (переход на метку $К1р), либо сохра- 
няет его в другом массиве (в данном случае — а2): 


165% 

15{5м АХ 
зайР 

де $К1р 


Массивы элементов адресуются регистрами ЕЗ1 (исходный массив а1) и Е] 
(массив а? ненулевых элементов). Размер массива а? в общем случае должен быть 
не меньше размера массива а1. | 

Следующая команда, которую мы рассмотрим, — хат. Команда очень полезна 
при анализе содержимого вершины стека $%(0), что часто помогает при отладке про- 
грамм. В зависимости от результата анализа команда Гхат устанавливает соответст- 
вующим образом биты с0—с3 в регистре состояния сопроцессора $мг. Некоторые из 
комбинаций этих регистров и соответствующие им состояния приведены в табл. 9.2. 

Рассмотрим пример использования команды Рхат. Исходный текст пропедуры 
(она называется _Рхат_дето) показан в листинге 9.7. 
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Таблица 9.2. Биты состояния и содержимое вершины стека 

сз ©2 <1 с0 Значение 

Положительное нечисло (+МАМ) 
Отрицательное нечисло (-МАМ) 
Корректное положительное число 
Положительная бесконечность 
Корректное отрицательное число 
Отрицательная бесконечность 


ооосоос>ес 
ы=н‚=нье>е 
ннеоео,<%$ 
неноеос-е+е 


Листинг 9.7. Определение типа содержимого вершины стека 


.686 
пе] Раф 
ор1оп сазетар: попе 
.дата 
а1 00 45.2. -3.14. -88.4. 5.6. -11.34. 0, 1.33 


Теп ЕСУ $-0р1 

роз _пим ОВ "Митбег 1$ роз1%1уе".0 

пед_пит ОВ "Митбег 1$ педаф1уе”.0 

отпег ОВ "Отпег меап1пд“, 0 

‘егг_рагм ОВ "Гисоггесе уа1ие от рагатефег!".0 


‚ соде 
_Рхам_дето ргос 
ризп ЕВР 
оу  ЕВР. ЕЗР 
оу  ЕСХ. дога риг [ЕВР+8] 
стр ЕСХ. 6 
39 — 'топд_рагат 
$1 ЕСХ, 2 
1еа  ЕЗГ. а! 
Ни 
#9  дмога рег ГЕЗТОГЕСХ] 
Тхат 
1$%&5м АХ 
ап@ АН, 7И 
стр АН. 4И 
}е роз_соггес+ 
стр АН. би 


уе пед_соггес® 
Теа  ЕАХ. окпег 


длр ехи 
роз_соггесе: 

1еа  ЕАХ, роз_пит 

Злр ех® 
пед_соггесе: 

1еа  ЕАХ. пед пит 

Злр ех® 


игопд_рагам: 
1еа  ЕАХ. егг_рагт 
ех{: 
рор ЕВР 
ге 
_Рхат_детю епбр 
ета 
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Процедура _хат_дето передает в вызывающую программу строку с инфор- 
мацией об элементе массива а1 чисел с плавающей точкой, принимая в качестве 
параметра номер элемента массива. Параметр извлекается с использованием ре- 
гистра ЕВР и помещается в ЕСХ, причем его значение должно находиться в диапазо- 
не 0-6, что отслеживается командой 


стр ЕСХ. 6 


При выходе значения счетчика за пределы диапазона в регистр ЕАХ помещает- 
ся адрес строки егг_рагт и процедура завершается. 
Адрес массива а1 загружается в регистр ЕЗ1 с помощью команды 


1еа ЕЗ1. а1 


После этого элемент массива помещается в вершину стека и выполняется его 
анализ: 


{19 — 9югд рёг [ЕЗПГЕСХ] 
Тхат 


Далее выполняется анализ битов с0—с3 регистра состояния (5мг), для чего со- 
держимое регистра $иг вначале помещается в ЕАХ командой 15&5м АХ. В данной 
процедуре мы анализируем три состояния вершины стека: 


е® является ли содержимое вершины стека корректным значением положи- 
тельного числа, 


е® является ли содержимое вершины стека корректным значением отрица- 
тельного числа, 


® является ли содержимое вершины стека чем-то иным, чем указанные выше 
значения. 


Для удобства анализа замаскируем незначащие для процедуры биты в реги- 
стре АН: 


ап@ АН, 7 


Согласно табл. 9.2 корректному положительному числу соответствует значе- 
ние 4 (с2 = 1, с1 = 0, с0 = 0), поэтому можно проверить этот вариант с помощью 
команд 


стр АН. 41 
де ро$_соггесе 


Если число является корректным и положительным, в регистр ЕАХ помещается 
адрес строки ро$_пит и происходит выход из процедуры. Если это не так, выпол- 
няется проверка на корректное отрицательное число: 

стр АН, 6И 

уе пед_соггес+ 

Если содержимое вершины стека является корректным отрицательным чис- 
лом, то в регистр ЕАХ помещается адрес строки пед_пит и процедура завершается. 
Если не выполняется ни одно из предыдущих двух условий, то в регистр ЕАХ зано- 
сится адрес строки о{Пег и происходит выход из процедуры. 
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В приводимых примерах использовались только команды для обработки чи- 
сел с плавающей точкой, но модифицировать эти примеры так, чтобы они рабо- 
тали с целыми числами, не составит труда. Для этого команды обработки чисел 
с плавающей точкой следует заменить соответствующими командами обработки 
целых чисел. 

Начиная с процессора Пие! Репиит Рго, группа команд сравнения пополни- 
лась двумя новыми командами: сот! и (сотр. Эти команды выполняют те же 
операции, что и {сот и ГСопр, но в отличие от последних не требуют специальных 
команд для обработки битов с0—с3 регистра мг, а устанавливают флаги 22, СЕ и РЕ 
непосредственно в регистре флагов ЕРЕАб5 центрального процессора. Рассмот- 
рим пример применения команды 1сот1. Следующая процедура (она называется 
Тсот1_4ето) сравнивает два числа с плавающей точкой, которые являются ее па- 
раметрами, и возвращает адрес большего из них в регистре ЕАХ (листинг 9.8). 


Листинг 9.8. Сравнение двух чисел с плавающей точкой 


.686 

„тодей ЕТаф 

ор1оп сазетар:попе 

„дата 

. ге$ 000 

.соде 

Тсот1_детю ргос 
ризй ЕВР 
му  ЕВР. ЕЗР 
#11 


#9 дога рег [ЕВР+12] 
#19 — дюга рёг [ЕВР+8] 
сот? $. $%(1) 
да заме_ор1 
хп $4(1) 
зауе_ор1: 
Тр ФмогЧ рег гез 
1еа  ЕАХ. гез 


рор ЕВР 

ге 
Тсотй делю епар 
епд 


Для извлечения операндов процедура использует регистр ЕВР. Оба операнда за- 
гружаются в стек регистров при помощи двух команд 1194. Команда Тсот1 5%. $1(1) 
сравнивает содержимое регистров $1(0) и $1(1) и в зависимости от результата 
устанавливает флаги 21, СЕ и РЕ. Большее из чисел помещается в регистр $1(0) по- 
сле выполнения команд 

да зауе_ор1 

хп $1) 
зауе_ор1: 

Т5фр мог рёг гез 

Команда хсИ $(1) выполняет обмен содержимым регистров $%(0) и $1 (1), если 
содержимое $*(1) больше содержимого $1(0). Значение максимума помещается 
в переменную ге5, а адрес переменной гез — в регистр ЕАХ. 
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Использование команды {сот позволяет избавиться от команд 1515 АХ и зай, 
что повышает (особенно при большом количестве операций сравнения, выпол- 
няемых в циклах) быстродействие программы. 

Помимо команд {сот1 и сотр, в систему команд процессоров [14], начиная 
с Репцит Рго, включены команды, которые можно обозначить как ТстоуСС, где 
СС — мнемоническое обозначение кода условия (Ъ, пЬ, е, пе, Бе, пе). Эти команды 
выполняют копирование регистра $1(1) в регистр $1(0), если выполняется ука- 
занное в команде условие. Форматы команд и анализируемые ими флаги показа- 
ны в табл. 9.3. 


Таблица 9.3. Форматы команд «тоуСС 


Мнемоническое обозначение Состояние флагов Описание условия 
стоуБ СЕ=1 | Меньше 

ГстоупЬ СЕР =0 Не меньше 

{томе 22 =1 Равно 

{стоупе 2Е=0 Не равно 

Естоубе (СР или 2Р) = 1 Меньше или равно 
{стоупБе (СР или 22) = 0 Не меньше или не равно 


Так же как и команды стоуСС, команды ТстоуСС хорошо подходят для оптими- 
зации вычислительных алгоритмов, исключая избыточные ветвления и переходы 
в программе. Хочу отметить, что не все процессоры семейства РепНит Рго под- 
держивают эти команды, поэтому, прежде чем их применять, нужно получить 
расширенную информацию о процессоре с помощью команды сри14. 

Продемонстрирую возможности команд ТстоуСС на примере программного 
кода процедуры стом ех (листинг 9.9). 


Листинг 9.9. Попарное сравнение элементов массивов 


. 686 
„люде? Р1а% 
орЕТоп сазетар: попе 
‚дата 
а1 00 56.78. -43.2. 0.0, 78.23. -12.2 
1еп ЕСИ $-а1 
Л 00 134.78. 67.45, -8.5. 32.18, -17.04 
гез 00 1еп ОР (0) 
.соде 
Тстоу_ех ргос 
оу ЕСХ. 1еп 
зп’ ЕСХ. 2 
1Теа ЕЗГ. а1 
]Теа ЕОГ. 61 
]Леа ЕОХ. ге$ 
111+ 
пех: 
24 дога раг [Е$П 
#9 9могд рёг ГЕОТ] 
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Тсотт $$. $(1) 
Тстоуб $%.$8(1) 
15%р дмога рег [Е0Х] 
а94 ЕЗГ. 4 
а ЕОГ. 4 
а94 ЕОХ. 4 
дес ЕСХ 

72 пеж 

Теа ЕАХ. гез 
гее 

Тстоу_ех епар 
епа 


В области данных процедуры определены три массива чисел с плавающей точ- 
кой: а1, Ь1 и гез. Программа выполняет попарное сравнение элементов масси- 
вов а! и 61, находящихся на одинаковых позициях, и помещает больший из них 
в массив гез. Процедура возвращает адрес массива гез в регистре ЕАХ. Проанали- 
зируем программный код процедуры. 

Доступ к элементам всех трех массивов осуществляется посредством регистров 
ЕТ, ЕОТ и ЕБХ, а счетчик элементов массивов находится в регистре ЕСХ. В каждой 
итерации в регистры стека $%(0) и $4 (1) загружаются элементы массивов а1 и Ь1 
(команды {14 дога ри [ЕЗТ] и 14 дмога рег [Е0Т1). С помощью команды Гсот1 $4. 
$ (1) числа сравниваются, и в результате устанавливаются соответствующие биты 
в регистре флагов. 

Команда Рсто\б $&. $1(1) копирует содержимое регистра $1(1) в регистр $1(0) 
в случае, если значение в $%(0) оказалось меньше $1(1). Если условие не выполне- 
но, то есть содержимое $1(0) больше $1(1), команда ничего не делает. Таким обра- 
зом, в регистре, являющемся вершиной стека, в любом случае окажется больший 
элемент. Применение команды Тсто\Ь позволяет при этом избежать ветвления 
с помощью одной из команд перехода. 

Команда Р5Ёр дога рёг [ЕОХ] запоминает содержимое регистра $%1(0) в массиве 
гез, а инструкция Теа ЕАХ, гез сохраняет адрес массива в регистре ЕАХ, после чего 
осуществляется переход к адресам следующих элементов массивов: 


99 ЕЗТ. 4 
а99 ЕОТ. 4 
а99 ЕОХ. 4 


Команда аес ЕСХ управляет числом итераций цикла, выполняя переход к сле- 
дующей итерации, если содержимое ЕСХ не равно 0. 

Прежде чем закончить анализ команд сравнения, хочу упомянуть о ситуации, 
когда один или оба операнда оказываются некорректными целыми или вещест- 
венными числами. Для того чтобы все-таки выполнить операции над такими чис- 
лами, в системе команд предусмотрены три команды: 


® Гисот ${(1) — сравнение неупорядоченных чисел в регистрах $1(0) и $%(7); 


® Гисотр $1(1) — сравнение неупорядоченных чисел в регистрах $1(0) и $%(1) 
с выталкиванием чисел из вершины стека; 


® Гисотрр $1(7) — сравнение неупорядоченных чисел в регистрах $1(0) и $1 (7) 
с выталкиванием чисел из регистров $%(0) и ${(1). 
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В группу арифметических команд входят команды, реализующие операции 
сложения, вычитания, умножения и деления. В свою очередь, арифметические 
команды можно разделить на две подгруппы для работы с целочисленными и ве- 
щественными операндами. Вначале рассмотрим команды для работы с цело- 
численными операндами. Они манипулируют данными размером в 16 и 32 бита 
и включают в себя: 


® 11204 операнд — сложение содержимого вершины стека $%(0) с целочислен- 
ным операндом размером 16 или 32 бита, результат сложения сохраняется 
в регистре $%(0); 


» 11516 операнд — вычитание целочисленного операнда размером 16 или 
32 бита из содержимого вершины стека $1(0), результат вычитания сохра- 
няется в регистре $10); 


® Ги операнд — умножение содержимого вершины стека $1(0) на целочис- 
ленный операнд размером 16 или 32 бита, результат умножения сохраняет- 
ся в регистре $1(0); 


® 141у операнд — деление содержимого вершины стека $%(0) на целочислен- 
ный операнд размером 16 или 32 бита, результат деления сохраняется в ре- 
гистре $1(0); | , 


® 1515г операнд — вычитание содержимого регистра $1(0) из целочислен- 
ного операнда размером 16 или 32 бита, результат вычитания сохраняется 
в регистре $10); 


® Г11уг операнд — деление целочисленного операнда размером 16 или 32 би- 
та на содержимое вершины стека $%(0), результат деления сохраняется в ре- 
гистре $%(0). 


Приведу пример использования целочисленных арифметических команд. Пред- 
положим, необходимо вычислить выражение (а + 5)/(а - Ь), гдеа и Ь — целые 
числа. Эту операцию можно выполнить с помощью процедуры _1п*_орз, мнемо- 
ническое обозначение которой можно представить как _1пё_орз(а, 6). Процедура 
возвращает округленное до ближайшего целого числа значение, если параметры 
аифне равны, или 0 в случае равенства операндов. Исходный текст процедуры 
показан в листинге 9.10. 


Листинг 9.10. Вычисление выражения, содержащего целые числа 


.686 
‚одет Е1аф 
орё1оп сазетар: попе 
.дата 
0р1 000 
гез 000 
.с0де 
_1й® орз ргос 
ризп  ЕВР 
тпоу ЕВР, ЕЗР 
Ни 
1119 дога р&г ГЕВР+8] 
сот ога рег [ЕВР+12] 
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1545 АХ 
зан+ 
Ау. ед 0 


ТА5и6 дога риг [ЕВР+12] 
115$6р мог рёг ор1 
1119 дога рёг [ЕВР+8] 
4а99 дога рег [ЕВР+12] 
+101у дога рёг ор1 
1154р мог рёг гез 


еч_0: 

Теа ЕАХ. гез 
ех1{: 

рор ЕВР 

ге 
1 орз епар 
епа 


Предположим, что параметры в процедуру передаются через стек, причем по 
большему адресу в стеке находится число 5, а по меньшему — число а. Для извле- 
чения параметров из стека используется регистр ЕВР, тогда число а находится по 
адресу [ЕВР+8], а число $ — по адресу [ЕВР+12]. Поскольку делитель выражения, 

‚равный а - 5, не должен равняться нулю, то вначале выполняется проверка на ра- 
венство значений переменных аи 6: 


1119 дога рёг [ЕВР+В] 
сот юга рег [ЕВР+12] 


1545м АХ 
занп+ 
Ау ед_0 


Если а равно В, то происходит выход из процедуры, а в регистре ЕАХ возвраща- 
ется 0. Если же операнды не равны, то вначале находится разность а - В (дели- 
тель), которая сохраняется в переменной ор]: 


1зиб юга ри“ [ЕВР+12] 
Нбр Ффмога риг орё 


Далее необходимо найти сумму а + 6, что делается при помощи команд 


{+119  дмога рег [ЕВР+8] 
{1а49 многа рёг ГЕВР+12] 


Наконец, команда 1191\ дног4 рёг ор1 находит частное (а + 5)/(а - 6), которое 
затем помещается в переменную ге5. Поскольку выполняется целочисленное де- 
ление, то результат округляется до ближайшего целого числа. 

Большим разнообразием выделяется набор арифметических команд для рабо- 
ты с вещественными числами. Анализ начнем с команд сложения. Команды этой 
группы имеют следующий синтаксис: 

{а99 приемник. источник 


Та@ар приемник, УТ 
{а94 источник 


Здесь приемник — операнд-приемник, а источник — операнд-источник. Ко- 
манды выполняют сложение содержимого операнда-источника с содержимым 
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операнда-приемника, сохраняя результат в операнде-приемнике. Если оба опе- 

ранда являются регистрами стека, то одним из них обязательно должен быть ${(0). 

Если единственным операндом является ячейка памяти (32 или 64 разряда), 

то вторым операндом будет регистр $1(0), в котором и сохраняется результат. 
Далее приводится более подробное описание команд сложения: 


® 1804 — сложение содержимого вершины стека $%1(0) и регистра $%(1), ре- 
зультат сложения сохраняется в регистре $1(0); 


® 1804 источник — сложение содержимого вершины стека $1(0) и ячейки па- 
мяти источник, результат сложения сохраняется в регистре $10); 


® 1800 51, 5{(1) — сложение содержимого регистра стека $1(7) и вершины 
стека $1(0), результат сохраняется в регистре $1(0); 


® 1204 $1(1). 5+ — сложение содержимого регистра стека ${1(7) и вершины 
стека $1{0), результат сохраняется в регистре $1(7); 


® Таар $%(Т). 51 — выполняет сложение содержимого регистра стека $%(7) 
и вершины стека $%1(0), после чего выталкивает значение из вершины стека, 
результат операции сохраняется в регистре $%4(1-1). 


Следующая подгруппа команд, которую мы проанализируем, — команды вы- 
читания вещественных чисел. Команды этой группы имеют следующий синтаксис: 


Т5и6 приенник. источник 
Тибр приемник. 5Т 
Тзиб источник 


Здесь приемник — операнд-приемник, а источник — операнд-источник. Ко- 
манды выполняют вычитание содержимого операнда-источника из содержимого 
операнда-приемника, сохраняя результат в операнде-приемнике. Если оба опе- 
ранда являются регистрами стека, то одним из них обязательно должен быть $%(0). 
Если единственным операндом является ячейка памяти (32 ‘или 64 разряда), то 
вторым операндом будет регистр $&(0), в котором и сохраняется результат. 

Вычитание чисел с плавающей точкой выполняется такими командами: 


® 1516 — вычитание содержимого регистра $%1(1) из содержимого вершины 
стека ${(0), результат вычитания сохраняется в регистре $1(0); 


® [56 источник — вычитание содержимого операнда источник, расположен- 
ного в памяти, из содержимого вершины стека ${(0), результат вычитания 
сохраняется в регистре $1(0); 


® 1516 $1, $1(7) — вычитание содержимого регистра ${(1) из содержимого ре- 
гистра стека 5%(0), результат сохраняется в регистре $%(0); 


® 1516 51(Т). 51 — вычитание содержимого регистра стека 51(0) из содержи- 
мого любого из регистров $1(7), результат сохраняется в регистре $%(0); 


® Тибр $1(1). $ — выполняет вычитание содержимого регистра стека $%(0) 
из содержимого любого из регистров $1(7), после чего выталкивает значе- 
ние из вершины стека, результат операции сохраняется в регистре $1(1-1); 


® Т5\бг $%(7). 5% — вычитание содержимого регистра стека $%(0) из содержи- 
мого любого из регистров $&(1), результат сохраняется в регистре 51(0); 
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® Т5ибгр 5%(Т). $& — выполняет вычитание содержимого регистра стека $1(0) 
из содержимого любого из регистров $1(1), после чего выталкивает зна- 
чение из вершины стека, результат операции сохраняется в регистре $%(1-1). 


Следующая подгруппа команд, которые мы будем анализировать, — команды 
умножения. Все команды этой группы имеют следующий синтаксис: 


тии] приемник. источник 
т/Лр приемник, 5Т 
и] ИСТОЧНИК 


Здесь приемник — операнд-приемник, а источник — операнд-источник. Коман- 
ды этой группы выполняют умножение операнда-приемника на операнд-источник, 
сохраняя результат в операнде-приемнике. Если в качестве операндов указаны 
регистры стека сопроцессора, то один из них должен быть $4(0). Если в качестве 
единственного операнда выступает ячейка памяти, то вторым операндом по 
умолчанию является регистр $%(0), сохраняющий результат операции. Операнды, 
представленные переменными в памяти, могут быть 32- или 64-разрядными. 

В эту группу включены следующие команды: 


® Ти — умножение содержимого регистра вершины стека $1(0) на содержи- 
мое регистра $%(1), результат сохраняется в регистре ${(0); 


® Ти $, $1(1) — умножение регистра $1(0) на содержимое регистра $1(7), 
результат сохраняется в регистре $1(0); 


® ТЫ $1(1), $4 — умножение содержимого регистра $1(0) на содержимое од- 
ного из регистров $%(1), результат сохраняется в регистре 51(1); 


® Пр $27). $ — выполняет умножение, так же как команда ти] $%(7), $1, 
и, кроме того, выталкивает содержимое вершины стека $1(0), результат 
умножения остается в регистре $1(1-1). 


Последняя подгруппа команд, которую мы рассмотрим, — команды деления. 
Все команды этой группы имеют следующий синтаксис: 


Т91у приемник. источник 
Тур приемник, $Т 
ТА1\у источник 


Здесь приемник — операнд-приемник, а источник — операнд-источник. Коман- 
ды этой группы выполняют деление операнда-приемника на операнд-источник, 
сохраняя частное в операнде-приемнике. Если в качестве операндов указаны регист- 
ры стека сопроцессора, то один из них должен быть $1(0). Если в качестве единст- 
венного операнда выступает ячейка памяти, то вторым операндом по умолчанию 
является регистр $%(0), в котором сохраняется результат операции. Операнды, 
представленные переменными в памяти, могут быть 32- или 64-разрядными. 

В эту группу включены такие команды: 


® 1091у — деление содержимого регистра ${(1) на значение, находящееся в вер- 
шине стека $((0), результат операции сохраняется в регистре $1(0); 


® Т91У 51. $1(1) — деление содержимого регистра $%(0) на значение, находя- 
щееся в регистре $%(1), результат операции сохраняется в регистре $1(0); 
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Ту 54(Т), ${ — деление содержимого регистра $1(7) на значение, находя- 
щееся в регистре $1(0), результат операции сохраняется в регистре 51(1); 


Ч1ур $%(7). $4 — выполняет деление, так же как и команда Т91\ $1(7). $, но 
выталкивает содержимое вершины стека, результат операции помещается 
в регистр $%(1-1); 

ТАтуг 5Е(Т). $4 — деление содержимого регистра 5%(7) на значение, находя- 
щееся в вершине стека 5% (0), результат операции помещается в регистр $%(0); 


ТА1угр 5Е(7), $ — деление содержимого регистра $%(7) на значение, нахо- 
дящееся в вершине стека $%(0), результат операции помещается в регистр 
$%(1), после чего содержимое $%(0) выталкивается из стека, а результат 
деления остается в регистре $%(1-1). 


Для демонстрации работы вещественных арифметических команд разработа- 
ем простую процедуру (назовем ее геа1_орз), в которой вычисляется значение вы- 


ражен 


ия с, х (а, + В, )/а, х (а, - В), где а, В, с,, 4, — числа с плавающей точкой 


(листинг 9.11). 


Листинг 9.11. Вычисление значения выражения, содержащего числа с плавающей точкой 


.686 
„тоде] Раф 
орЁ1оп сазетар: попе 
‚Чата 
а1 002.0 
1 005.5 
с1 00 -3.5 
91 006.8 
гез 000 
.с0де 
геа1_орз ргос 
11115 ; инициализировать сопроцессор 
НЯ дмог@ рег а1 ; поместить а] в вершину стека $5%(0) 
{сот Фиога р\г 61 : сравнить с 61, если равны, то знаменатель 
: выражения равен 0 
: выйти из процедуры. поместив в регистр 
; значение 0 
55м АХ : сохранить содержиное регистра состояния $мг 
: В регистре АХ 
зап? ; поместить содержимое регистра АН 
; В регистр флагов 
ку. ех1& ; если а1 = 61. выйти из процедуры. установив 
; регистр АХ в 0. иначе продояжить 
; вычисления 
Та9Ч @иог@ рёг 51 : прибавить к а1 значение Ь1, после чего 
; вершина стека $%(0) будет содержать а1 + 51 
М] дога рёг с] ; умножить содержимое $1(0) на с1 
: после этой операции вершина стека $%(0) 
; содержит значение с] * (а1 + 61) 
{19 мог рёг а1 ; загрузить в стек значение а1 
Тзиб Фмога рёг 51 ; вычесть 61 из а1 
ти] Фног@ рёг 91 ; умножить разность Ь] - а! на 91 


: после этой операции вершина стека $%(0) 
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; содержит значение 91 * (а1 - 61). Значение 
; С1* (а] + Ь1) находится в регистре $(1) 
А : разделить содержимое регистра $(1) 
; на содержимое вершины стека $&(0) 
Т5&р Чмога р“ гез : сохранить значение с1 * (а1 + 51)/91 * (а1 - 61) 
; в переменной ге$ и вытолкнуть значение 
; из вершины стека 
ех{: . 
Теа ЕАХ, гез ; поместить адрес результата в регистр ЕАХ 
ге 
геа1_ орз епар 
епа 


При указанных значениях операндов перед выходом из процедуры перемен- 
ная гез будет содержать значение 1,1. 

Для вычисления значений тригонометрических функций, таких, как синус, ко- 
синус, тангенс, арктангенс, а также логарифмических и показательных функций 
в математический сопроцессор включен целый ряд так называемых трансцен- 
дентных команд. С их помощью выполняются вычисления для всех обычных 
тригонометрических, обратных тригонометрических, гиперболических, обратных 
гиперболических, логарифмических и степенных функций. Обычно такие вычис- 
ления занимают много времени и являются очень интенсивными по использова- 
нию ресурсов процессора. 

Трансцендентные команды, как правило, работают с верхними элементами ре- 
гистрового стека — регистром вершины стека $%(0) и регистром $1(1). Команды 
для вычисления тригонометрических функций работают с аргументами, выра- 
женными в радианах, поэтому для вычисления функции угла, заданного в граду- 
сах, следует вначале преобразовать это значение в радианы. Для такого преобра- 
зования можно использовать формулу 


Угол (рад) = Угол (град) х л/180. 


Рассмотрим более подробно трансцендентные команды. Вначале остановимся 
на командах вычисления синуса и косинуса, которые имеют такой синтаксис: 

51 

{0$ 

{511605 


Команда 151п замещает аргумент (в радианах), расположенный в вершине сте- 
ка ${(0), значением синуса. Аналогично, команда 1с0$ вычисляет косинус угла 
и помещает его в $1(0). Команда 1$1пс0$ комбинирует предыдущие две команды 
и вычисляет обе функции следующим образом: 


® значение синуса угла помещается в $%1(0); 
® косинус угла помещается в стек регистров. 


Таким образом, после выполнения операции косинус угла окажется в вершине 
стека $1(0), синус — в регистре 51(1). Следующий пример демонстрирует вычисле- 
ние синуса и косинуса угла, заданного в градусах, и реализован в виде процедуры 
_$1пс0$_детю, которая в качестве параметра принимает угол в градусах (листинг 9.12). 
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Листинг 9.12. Вычисление синуса и косинуса угла 


.686 
„тоде] РТаё 
ор 1оп сазетар: попе 
. ата 
сое{Р 00 0.0174 
$11С0$_уа1 Табе] дмога 
$1п_уа1 00 0 
с0$_уа1 00 0 
‚.соде 
_$1160$_Чето ргос 
ризи ЕВР 
ту  ЕВР. ЕЗР 
ая 
НО дога рег [ЕВР+8] 
Ти]  Фога рег сое? 
1511605 
Т5фр мог рёг со$_ма] 
Т5&р нога рёг $1п_ма1 
Леа  ЕАХ, $1псо$_ма1 


рор ЕВР 

ге 
_$1160$_Четю епар 
епа 


В области данных процедуры определена переменная сое! +, численно равная 
значению л/180, с помощью которой угол в градусах переводится в угол в радиа- 
нах. Для извлечения параметра используется регистр ЕВР, так что следующая ко- 
манда загружает в вершину стека значение угла в градусах: 


79 дога рёг [ЕВР+8] 


С помощью команды ти] дога рёг сое? значение угла переводится в радиа- 
ны, а команда 1$1пс05$ вычисляет значения синуса и косинуса угла. Следующие 
две команды 15%р позволяют сохранить полученные значения в области памяти 
$1пс05_\а1. Последний шаг — сохранить адрес памяти с полученными значениями 
в регистре ЕАХ (команда 1еа ЕАХ, $1пс05_ма1), после чего выйти из процедуры. 

Вызывающая программа для проверки работоспособности этой процедуры на 
\У15иа! С++ МЕТ может выглядеть так, как показано в листинге 9.13. 


Листинг 9.13. Демонстрационная программа для процедуры из листинга 9.12 
ЗАпстиде <$%410.1> 

ехрегп “С” ЕТоа{* $1псоз_дето(Роаё апд1е): 

ти та1п(у019) 


Поаф апд1е = 34: 

Поа{* гез = $1пс0$_дето(апа?е): 
ргтпЕ("51те: %5.21\4". *гез): 
реп ( "Соз1пе: #5.27\\п", *++гез): 
гефиги 0; 


} 


В этом приложении процедура $1пс0$_4дето объявлена как внешняя, прини- 
мающая параметр в виде переменной с плавающей точкой апд1е. В программе 
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объявлена переменная-указатель ге5, принимающая адрес области памяти, содер- 
жащей результат. Далее, с помощью функции рг1"{ последовательно выводятся 
значения синуса и косинуса заданного угла. Для указанного угла, равного 34°, 
приложение выведет результат: 


$1пе: 0.56 Со$1пте: 0.83 


К тригонометрическим командам относится и Рр\ап. Она вычисляет частич- 
ный тангенс угла, значение которого находится в вершине стека сопроцессора. 
Результат возвращается в регистрах $1(0) (значение косинуса) и $%1(1) (значение 
синуса). Следующий пример демонстрирует вычисление тангенса угла с помо- 
щью процедуры _Трёап_дето. Процедура в качестве параметра принимает значе- 
ние угла в градусах, а возвращает адрес переменной, содержащей значение тан- 
генса (листинг 9.14). 


Листинг 9.14. Вычисление тангенса угла 


.686 
„тоде] +1а& 
орЁ1оп сазетар:попе 
. .Чаба 
соетР 00 0.0174 
Фап_уа? 000 
_1р®ап_Чето ргос 
ризи ЕВР 
тоу  ЕВР. ЕЗР 
{11 
+19 дога раг [ЕВР+8] 
ти]  дмога рфг соеР 
Треап 
ТАТуг 5%. $%(1) 
Т5фр @мюгд рег Тап_уа1 
1еа  ЕАХ. Сам ма! 


рор  ЕВР 

ге 
_1реап_дето епар 
епа 


Как и в предыдущем примере, в этой процедуре имеется переменная соетТ, со- 
держащая коэффициент перевода угла в градусах в угол в радианах. Команда 
Трфап вычисляет значения синуса и косинуса, причем в регистре ${(0) располага- 
ется значение косинуса угла, а в регистре $1(1) — значение синуса. Собственно 
тангенс угла вычисляется как соотношение синуса к косинусу, что и выполняет 
команда 


ТОТуг 56, $%(1) 


После выполнения этой команды регистр $1(0) будет содержать тангенс угла, 
который сохраняется в переменной {фап_уа1 следующей командой: 


Тз&р дмога рёг бап_уа] 
Адрес этой переменной в регистре ЕАХ и возвращает процедура. 
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К этой группе относится еще одна команда, позволяющая по значению танген- 
са угла вычислить сам угол. Это команда Трафап. К. сожалению, в некоторых лите- 
ратурных источниках команда Графап описана неправильно, поэтому я подробно 
остановлюсь на принципе ее работы. Вычисление производится по формуле 


7- АВСТАКСУ/Х), 


где соотношение У/Х является тангенсом искомого угла, причем значение Х 
берется из регистра $1(0), а У — из регистра ${(1). Результатом выполнения ко- 
манды является угол 2 (в радианах!), значение которого помещается в вершину 
стека $%(0). 

Возникает вопрос, каким образом. вычислить значение угла, используя не 
два аргумента (Х и У), а всего один. Выход очень простой: нужно в качестве Х 
задать 1, тогда можно использовать один аргумент (У). Это продемонстрировано 
в следующем примере (листинг 9.15). Здесь с помощью процедуры _агс&9_дето 
вычисляется угол, тангенс которого служит единственным параметром функции 
и передается через стек. Результат (значение угла в градусах) помещается в пере- 
менную гез, адрес которой возвращается в вызывающую программу в регистре ЕАХ. 


Листинг 9.15. Вычисление арктангенса по заданному значению тангенса угла 


.686 
„тоде] Р1а{ 
орё1оп сазетар: попе 
„афа 
сое? Р 00 57.32 ; коэффициент для перевода значения 
; угла из радиан в градусы 
: и численно равный 180/р1 
ге 000 
.соде 
_агс9_дето ргос 
ризи ЕВР 
тоу  ЕВР. ЕЗР 
111% 
+19 дога руг ГЕВР+8] ; значение тангенса угла 
#191 ; константа 1 
; после предыдущих двух команд регистр $(0) содержит 1. 
: а регистр $&(1) - значение тангенса искомого угла 
Трафап ; вычислить угол 
ти] Омога рАг сое?Р —: перевести значение угла в градусы 
15&р ога ри“ гез : сохранить результат в переменной гез 
: и вытолкнуть содержимое из вершины стека 
1еа  ЕАХ. гез ; адрес результата -> ЕАХ 
рор  ЕВР 
ге 
_агсё9_дето епар 
ела 


Программный код этой процедуры достаточно подробно описан в комментари- 
ях, поэтому дополнительные пояснения к исходному тексту, думаю, не требуют- 
ся. Приведу пример тестовой программы для проверки работоспособности про- 
цедуры _агсд_дето, написанной на У\!15иа| С++ МЕТ (листинг 9.16). 
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Листинг 9.16. Демонстрационная программа для процедуры из листинга 9.15 


НпсТиде <$910.1> 
ехёегп “С” Р1оа{* агсё9_дето{Тоае +9): 
11 та1п(\01а) 


{ 

Поаё &9 = 2.94: 

рг1пЕР("Апо1е (дга@) = %5.2Р\п", *агсф9_дето(+9)): 
гебиги 0; 


} 


В этой программе процедура агс+9_дето объявлена внешней, в качестве пара- 
метра принимающей значение тангенса в формате числа с плавающей точкой. 
При указанном значении параметра (2,94) процедура возвращает значение угла, 
равное 71,25°. 

Команда Графап очень полезна при вычислении значений других обратных три- 
гонометрических функций, таких, например, как арксинус или арккосинус. Для 
подобных вычислений используются стандартные математические соотношения. 
Например, для вычисления арксинуса (агсут) можно воспользоваться формулой 


1 
м1-Х? 

Рассмотрим пример вычисления арксинуса. Из формулы видно, что одним из 
промежуточных действий является вычисление квадратного корня выражения 
1 - Х2. В набор команд математического сопроцессора входит команда Т54г\, по- 
зволяющая вычислить значение квадратного корня из числа, находящегося в вер- 
шине стека 51 (0). Команда не имеет аргументов и возвращает значение в вершине 
стека. 

Вычисление арксинуса применительно к командам сопроцессора можно вы- 
полнить, используя мнемоническое выражение 


У = рагап (Х/баг(1 - Х?)), 


_ где Х — синус угла, У — значение угла, который следует найти по известному зна- 
чению Х. 

Далее представлен исходный текст процедуры (назовем ее _агс$1п_дето), вы- 
числяющей значение агсзш Х по заданному значению синуса. Исходный текст 
процедуры достаточно сложен, поэтому я объясню смысл команд подробно. Как 
и в предыдущем примере, процедура сохраняет результат (угол в градусах) в пе- 
ременной ге5, возвращая в вызывающую программу адрес этой переменной в ре- 
гистре ЕАХ. 

В качестве единственного параметра процедура _агс$1п_дето принимает значе- 
ние синуса угла (не угла!). Для извлечения параметра, как обычно, используется 
регистр ЕВР. Проанализируем исходный текст процедуры (листинг 9.17). 

Вначале посмотрим, что находится в области данных. Здесь определен коэф- 
фициент сое1Т, который нужен для перевода значения угла из радиан в градусы. 
Кроме того, присутствует и вспомогательная переменная опе, которая включена 
в программный код для большей ясности. Обратите внимание на то, что перемен- 
ная опе должна быть представлена в форме вещественного числа (1,0)! 


агсзш Х = агсёв 
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Листинг 9.17. Вычисление арксинуса через арктангенс 


.686 
„тоде] Раф 
орё1оп сазетар: попе 
„дата 
опе 001.0 
соетР 00 57.32 
ге 000 
„сое 
_агс$1п_детю ргос 
ризй ЕВР 
оу  ЕВР. ЕЗР 
Ни 
719 дога рак [ЕВР+8] 
79 дога раг [ЕВР+8] 
ти] 
Тси$ 
Та99 нога рёг опе 
Т5аге 
119 дмогд рег [ЕВР+8] 
Оу 5%. $((1) 
7191 
Трафап 
Ти? дмога рёг сое 
ех1т: 
{5%р Фмог4 рег гез 


1еа  ЕАХ, гез 

рор  ЕВР 

ге 
_агс$1п_детю епар 
епа 


Вычисления выполняются в последовательности, которую легко проследить, 
используя известную нам формулу У = рабап (Х/дгс(1 - Х?)). Напомню, что 
число Х соответствует параметру, передаваемому в процедуру. 

Вначале находим значение Х? с помощью команд 

79 дога рег [ЕВР+8] 

Иа дога рёг [ЕВР+8] 

Ти] | 

Далее, знак Х? меняется на минус с помощью команды Гсй5. Данная команда 
меняет знак значения, находящегося в вершине стека $1(0). После выполнения 
этой команды в вершине стека будет находиться значение -Х?. 

К полученному значению прибавляем 1 с помощью команды 


Та94 Фиога рёг опе 


Таким образом, в вершине стека к этому моменту содержится значение 1 - Х2. 
На следующем шаге вычисляем квадратный корень этого значения, используя 
команду Т5дг®. Следуя логике программы, нужно вычислить значение выражения 
Х/Баге - Х?): 

714 — дмога рёг [ЕВР+8] 

Т1у 3%. 541) 
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Теперь, как и в предыдущем примере, для формирования аргумента команды 
Трафап поместим в вершину стека 1, выполнив команду 1191. Наконец, можно при- 
менить команду Тратап и перевести полученное значение угла из радиан в градусы: 


Тратап 
ти] дога рёг сое!Р 


Полученное значение угла сохраняется в переменной гез, адрес результата — 
в регистре ЕАХ, и процедура завершается. Для проверки работоспособности проце- 
дуры можно воспользоваться, например, короткой программой на \У15иа! С++ МЕТ 
(листинг 9.18). 


Листинг 9.18. Демонстрационная программа для процедуры из листинга 9.17 


ННисТиде <5641о.п> 
ехбегп "С" РТоат* агсз1п_Чето(РТоа® $1пх): 
116 ма1п(\01) 


{ 
ПоаЕ $1их = -0.37: 


рг1ие{(”Апо1е (дгаа) = %5.21\п", *агс$1п_Чето($1пх)):; 
гефигп 0: 


} 

Перед использованием внешней процедуры следует объявить ее с директивой 
ех{еги. В качестве параметра в вызываемую процедуру передается значение веще- 
ственной переменной $1пх. В остальном исходный текст программы прост и в объ- 
яснениях не нуждается. 

При указанном значении синуса (-0,37) соответствующий угол равен -21,72°. 
В качестве упражнения читатели могут попробовать разработать процедуру для 
вычисления арккосинуса. 

Последняя подгруппа команд, которую мы проанализируем, позволяет вычис- 
лять значения логарифмических и показательных функций. К этим командам от- 
носятся: 


® 12хт1 — вычисляет значения функции у = `2х-!. Исходное значение парамет- 
рах должно находиться в вершине стека $1(0) и лежать в диапазоне —1 <х < 1, 
результат размещается в вершине стека (регистр $1(0)). Команда может ис- 
пользоваться для вычисления различных показательных функций; 


® 1у12х — вычисляет значение функции 2 = /о8.(х). Исходное значение х раз- 
мещается в вершине стека сопроцессора, а исходное значение у — в регист- 
ре $* (1). Значение х должно находиться в диапазоне 0 <х < +, а значение 
у — в диапазоне —с < у < +. Перед записью результата в вершину стека ко- 
манда Ру12х выталкивает из стека значения х и и и только после этого поме- 
щает результат 2 в $1(0); 

® Гу12хр1 — вычисляет значение функции г = Иово(х + 1), при этом исход- 
ное значение х размещается в вершине стека $%(0), а исходное значение у — 
в регистре $%(1). Значение х должно находиться в диапазоне 0 <|х|< 1-1 142, 
а значение у — в диапазоне — < у < +. Перед записью команда выталкива- 
ет значения х и у из стека, после чего результат 2 записывается в $%(0). 
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Перечисленные команды помогают вычислять самые разнообразные показа- 
тельные и логарифмические функции. Для иллюстрации рассмотрим пример вы- 
числения натурального логарифма числа. Вспомним формулу для вычисления 
натурального логарифма числа, если известен двоичный логарифм числа: 


п Х = 108, ХЛов» е, 


где Х — заданное число. 
Эту формулу можно представить в несколько ином виде: 


п Х = 1Лов, ех в. Х. 


Очевидно, что для вычисления натурального логарифма числа можно исполь- 
зовать команду 1уУ12х, при этом у следует взять равным 1/15, е. В листинге 9.19 
приведен исходный текст процедуры (она называется _1пх_4ето), вычисляющей 
натуральный логарифм числа, которое является параметром процедуры. 


Листинг 9.19. Вычисление натурального логарифма числа 


.686 
„тоде] Паф 
орёЛоп сазетар: попе 
.Чаба 
гез 00 0 
.соде 
_Тах_дето ргос 
ризп ЕВР 
ту  ЕВР, ЕЗР 
#9112 
91 
АУ 
#9 дога рёг [ЕВР+8] 
Ру12х 
Тр Фмога рег гез 
1Леа  ЕАХ. гез 
рор ЕВР 
ге 
_Лпх_@ето епар 
епа 


Параметр извлекается из стека посредством регистра ЕВР. Вычисление коэф- 
фициента 1/108, е выполняется с помощью команд 

ИФ та 

#91 

ТАУ 

После выполнения этих команд в стек загружается значение параметра и с по- 
мощью команды 1у12х вычисляется натуральный логарифм числа. Полученный 
результат сохраняется в переменной ге, а адрес переменной помещается в ре- 
гистр ЕАХ для возврата в вызывающую процедуру. Проверить работу процедуры 
можно с помощью простой программы на У!15иа! С++ МЕТ (листинг 9.20). 

При указанном значении параметра х (432,804) натуральный логарифм числа 
равен 6,07. 
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Листинг 9.20. Демонстрационная программа для процедуры из листинга 9.19 


НисТиде <$64о.1> 
ехёегп "С" Поаф* 1пх_4ето( оса х): 
116 ма1п(\019) 


‘ноя х = 432.804: 

ргТИЕЕ( "Ёп 46.37 = %5.2®\п", х. их _дето(х)): 
геигп 0: 

} 

К группе дополнительных арифметических команд относят несколько инструк- 
ций, выполняющих специфичные действия над одним операндом, находящимся 
в вершине стека $6(0). Некоторые команды (Т54гё, 1сй$) нам уже встречались, 
другие мы рассмотрим впервые. Вот перечень команд этой группы и их описание: 


® 159г{ — вычисляет квадратный корень из значения, находящегося в верши- 
не стека ${(0), помещая туда же результат; 


® ГСП5 — изменяет знак числа, находящегося в вершине стека $%(0), помещая 
туда же результат; 


® 125$ — вычисляет абсолютное значение (модуль) числа, находящегося в вер- 
шине стека $%(0), помещая туда же результат; 


е Г5сае — выполняет умножение содержимого вершины стека 51(0) на степень 2. 


Вычисление производится по формуле У = Ух 2Х, где У — значение, находя- 
щееся в $1 (0), а Х — масштабирующий множитель, находящийся в регистре $%(1). 
Результирующее значение замещает содержимое регистра $+(0), при этом масшта- 
бирующий множитель остается в 51(1) без изменения. Если масштабирующий 
множитель не является целым числом, то его значение округляется в меньшую 
сторону до ближайшего целочисленного значения. Приведу короткий пример 
программного кода, в котором используется команда Т5са1е (листинг 9.21). Про- 
цедура _15са1_ех принимает два параметра: масштабирующий множитель (ЕВР+12) 
и само число (ЕВР+8). Результирующее значение сохраняется в переменной гез, 
адрес которой процедура возвращает в регистре ЕАХ. 


Листинг 9.21. Применение команды б5сае 


.686 
„то4е] Нае 
орё1оп сазетар: попе 
.Чафа 
гез 000 
.соде 
_Вса1е_ех ргос 
ризи ЕВР 
ту  ЕВР. ЕЗР 


9 дмога рёг [ЕВР+12] ; масштабирующий множитель -> $&(1) 
Па 9мога рёг [ЕВР+8] ; число -> $%(0) 
фоса1е 
15р Омога рёг гез 
1еа  ЕАХ. гез 
рор ЕВР 
ге 
_Росайе_ех епар 
епа 
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Исходный текст процедуры понятен, и мы не будем на нем останавливаться. 
Для проверки результатов выполнения процедуры воспользуемся программой на 
\У!5 а] С++ МЕТ (листинг 9.22). 


Листинг 9.22. Демонстрационная программа для процедуры из листинга 9.21 


Нистиде <5410.п> 
ехбегп "С" РТоаф* Госа]е_ех(Тоае пит. РТоаё зса1е): 
11 ма1и(\019) 


Ноаё пит = 95.31; 

оае зса1е = -3.17: 

рг1пЕ+( "5са11п9 ма1ие: %6.3Р\п". *Ф5са1е ех(пит. зса?е)): 
гефигп 0: 


} 


При указанных значениях параметров и принятой точности (3 значащие циф- 
ры после точки) программа отображает такой результат: 


$са11п9 ма1ие: 11.914 


Следующая команда, которую мы рассмотрим, — Рхёгас{. Она выделяет из чис- 
ла, находящегося в вершине стека ${(0), порядок (ехропепё) и мантиссу (тап@$за, 
$етйсапа). При этом значение порядка помещается в регистр $ (1), а мантисса — 
в регистр $%(0). В листинге 9.23 приведен пример процедуры _Рхёгас&_ех, прини- 
мающей в качестве параметра число с плавающей точкой и возвращающей в ре- 
гистре ЕАХ адрес области памяти ге, в которой сохраняются значения мантиссы 
и порядка. 


Листинг 9.23. Применение команды б&гас 


.686 
„мое {1ае 
орЁ1оп сазетар: попе 
. дата 
гез Табе] одмога 


$1911 1сапа 00 0 
ехропеп* 060 


.соде 

_Ехёгасеех ргос 
ризп ЕВР 
тои  ЕВР. ЕЗР 
Па дога рег [ЕВР+8] : число -> $6(0) 
Рхбгасе 
Тур Фмога рёг з1дп1Р1сапа :; $%(0) -> $19п11сапа (тапё1$за) 
Т5{р мог рёг ехропет ; $6(1) -> ехропепт 
1еа  ЕАХ. дмог4 рег гез 
рор ЕВР 
ге 

_Рхёгасё_ех епар 

епа 


Проверить работоспособность процедуры _Рхёгас*_ех можно с помощью про- 
стой программы на \У1зиа| С++ МЕТ, вызывающей эту процедуру (листинг 9.24). 
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Листинг 9.24. Демонстрационная программа для процедуры из листинга 9.23 


ЯАпсТиде «50 .1> 
ехфегп "С" ЕТоа{* Рхёгасе_ех(ТТоае пит): 
ти матп(уо1а) 


Ноа пит = 95.31; 

Поае* рЕ = Рхёгасё ех(пит): 
реТпЕЕ("З19п1сапа: 48.5". *р++): 
реп ("Ехропепе: %5.21\п". *рЕ); 
гефигп 0: 


} 


При указанном значении параметра пит (95,31) и указанной точности програм- 
ма выводит на экран результирующие значения мантиссы и порядка: 


$1911 1сапа: 1.48922 Ехропепё: 6.00 


Рассмотрим назначение и синтаксис последней команды из этой группы — 
{гпа1п®. Эта команда выполняет округление числа, находящегося в вершине стека 
$&(0), до целого числа. Команда не имеет операндов и возвращает результат в ре- 
гистре $1(0). Допускается четыре режима округления, причем определяются они 
значением поля гс управляющего регистра сиг сопроцессора (см. рис. 9.8). Режим 
округления можно устанавливать в процессе выполнения программы до того, как 
потребуется эта операция. Для этого можно установить нужную комбинацию 
битов в поле гс регистра сиг, используя команды Г5&си (сохранение регистра сиг) 
и Я4си (загрузка регистра смг). 

Следующий пример демонстрирует работу команды Ггпатт". В примере показан 
исходный текст процедуры, выполняющий округление суммы двух вещественных 
чисел в зависимости от заданного режима (процедура называется _Ргпд1и®_ех). 
Процедура принимает три параметра: значения двух вещественных чисел и целое 
число, величина которого указывает режим округления. 

Параметр, указывающий режим округления, может принимать значения 0-3, 
при этом 0 соответствует режиму с гс = 00 (округления к ближайшему целому чис- 
лу), 1 — режиму с гс = 01 (округление в меныпую сторону), 2 — режиму с ге = 10 
(округление в большую сторону) и, наконец, значение 3 определяет режим с гс = 11 
(отбрасывания дробной части). 

Мнемонически процедуру можно записать так: 


_Фгпати_ех(ЕТоаё а, Р1оаф В, 1тё тоае) 


Процедура возвращает в регистре ЕАХ адрес переменной гез, содержащей ре- 
зультат. Исходный текст самой процедуры представлен в листинге 9.25. 


Листинг 9.25. Использование различных режимов округления 


.686 

„моде +1аё 

орЁ1оп сазетар: попе 
.дафа 

тазкК_гс Табе] мога 


Ом ОРЗЕРВ |; гс = ое 00 продолжение = 
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Листинг 9.25 (продолжение) 


0% ОР7ЕРЮ ; гс = мае 01 
м  ОРВЕРИ ; гс = моде 10 
м  ОРРЕРА |; гс = обе 11 
фтр м0 
гез 000 
.соде 
_гпазпе_ех ргос 
ризп ЕВР 
поу  ЕВР.ЕЗР 
моу  ЕСХ, Чмога рёг [ЕВР+16] 
$11  ЕСХ. 1 
1еа  ЕЗГ. мазК_гс 
а44  ЕЗГ. ЕСХ 
моу ОХ. мога рёг [Е$Т] 
{ие 
Т5&см тр 
ог фтр. 0000п 
ап@ тр. 0Х 
11 94см 1тр 
9 —дмога рёг [ЕВР+12] 
Та4Ч мог рег [ЕВР+8] 
гта 
Тур мог рёг гез 
1еа  ЕАХ. гез 


рор ЕВР 

ге 
_Чгпд1пе_ех епдр 
епа 


Проанализируем программный код _Тги41п®_ех и начнем с области данных. 
Здесь определено поле та5К_гс, каждый элемент которого является словом и со- 
держит маску для установки одного из четырех режимов округления. Фактиче- 
ски слово маски устанавливает одну из четырех комбинаций битов 10-11 поля гс 
в регистре управления смг. Для доступа к соответствующему слову маски в обла- 
сти памяти тазК_гс используется группа команд: 


моу  ЕСХ. Чмога рёг [ЕВР+16] 


$11  ЕСХ. 1 
1еа  ЕЗГ. мак _гс 
299 — ЕЗТ. ЕСХ 


тои ОХ. мога рАг [Е$Т] 


Смысл этих команд следующий: вначале в регистр ЕСХ помещается параметр, 
указывающий номер режима (число в диапазоне 0-3). Содержимое регистра ЕСХ 
служит индексом для выбора нужного элемента из поля тазК_гс, но поскольку 
элементы этого поля имеют размерность слова, то значение индекса в ЕСХ нужно 
умножить на 2. Затем в регистр Е51 помещается значение пазК_гс, которое являет- 
ся базовым для доступа к элементам этого поля данных (команда 1еа). 

Для вычисления смещения слова маски используется команда а94, прибавляю- 
щая смещение в ЕСХ к базовому адресу в регистре Е51. Наконец, последняя команда 
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этой группы помещает маску режима в регистр 0Х. В дальнейшем содержимое ре- 
гистра ОХ понадобится для управления регистром сиг. 

Следующие несколько команд обеспечивают непосредственную установку ре- 
жима округления. В регистр сиг нельзя записать непосредственное значение, но 
можно считать содержимое регистра в ячейку памяти, после чего модифициро- 
вать полученное значение и записать его обратно в регистр управления округле- 
нием. Команда {51см тр сохраняет содержимое регистра сиг в переменной +пр 
размером в слово. Следующие две команды корректируют считанное содержимое 
регистра сиг для работы в выбранном режиме: 


ог фир. 0С008 
ап@  1тр. 0Х 


Затем в регистр сиг записывается новое значение переменной {тр с помощью 
команды 


И 9см (тр 


С этого момента начинают действовать новые установки. 

Остальная часть программного кода процедуры демонстрирует собственно ра- 
боту самой команды Егп41пе. Вначале два числа складываются, при этом резуль- 
тат помещается в регистр $1(0). Для этого служат команды 


И дога рег [ЕВР+12] 
Та бога рёг [ЕВР+8] 
Команда Ргпа1и+ округляет число в регистре $%(0) в соответствии с установка- 


ми поля ге регистра сиг, которые только что были изменены. Для сохранения ре- 
зультата используется команда 


Т5Ер ога рёг гез 


Эта команда копирует значение $1(0) в переменную гез. 
Проверить работоспособность процедуры можно с помощью простой програм- 
мы на \150а| С++ МЕТ (листинг 9.26). 


Листинг 9.26. Демонстрационная программа для процедуры из листинга 9.25 


ННпсТиае <$%41о.П> 
ехбегп “С” Поаф* Ргпа1пе_ех(оаЕ а1. ТТоае 61. 1иё тоде): 
116 та1п(\01а) 


Тоаф а1 = 3.18: 

ПоаЕ 61 = 5.43: 

ргтпЕР( "Рог а1 = %5.2$, 1 = %5.2Р. а1+61 = %5.2:\п", а1. 1. а1+61): 
Тог (1 тоде = 0: моде < 4; тоде++) 


{ 
ргТПЕЕ("РЕВМОТМТ: гс=Ха, гоипаей зит = %5.2®\п", 
моде. *Ргпа1тё_ех(а1. 61. моде)): 


гебигп 0: 
} 
Здесь параметры а1и Ь1 определены как числа с плавающей точкой (110а%), а па- 
раметр поде принимает целочисленные значения в диапазоне 0—3. В зависимости 
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от значения переменной тоде программа будет выводить на экран разные зна- 
чения: 


Рог а1 = 3.18, Ы1 = 5.43. а1+1 = 8.61: 
ЕВМОТМТ: гс=0. гоипдед зит = 9.00 
ЕВМОТМТ: гс=1. гоипдед зит = 8.00 
ЕВМОТМТ: гс=2. гоцпдед зит = 9.00 
ЕВМОТМТ: гс=З, гоцпдеЯ зит = 8.00 


Последняя группа команд, которую мы рассмотрим, — управляющие команды 
математического сопроцессора. 

Как правило, эти команды не используются в вычислениях, а управляют дей- 
ствиями сопроцессора на системном уровне. Подобные действия включают в се- 
бя инициализацию модуля обработки операций с плавающей точкой, обработку 
численных исключений и переключение задач. Ознакомимся с синтаксисом ос- 
новных управляющих команд: 


Тиа1& — синхронизация работы процессора и математического сопроцессо- 
ра (если процессор встречает эту команду, он приостанавливает свою рабо- 
ту до окончания выполнения очередной команды сопроцессора); 


{11 — инициализация сопроцессора с помещением предопределенных 
значений в управляющие регистры сопроцессора (эта команда подробно 
рассматривалась в начале этой главы); 


1515 4е5{ — сохранение регистра состояния в 16-разрядном операнде 4е5%, 
слово состояния может сохраняться и в 16-разрядном регистре АХ; 


Т5&см 4е5{ — сохранение содержимого регистра управления в 16-разрядной 
переменной 4е5{ в памяти (команда обычно используется для анализа по- 
лей регистра сиг); 


{19см $гс — загрузка содержимого 16-разрядной переменной $гс в регистр 
сиг (команда используется для задания режимов работы сопроцессора); 


тсТех — сброс флагов исключений в регистре 5мг сопроцессора; 


{ис$ёр — увеличивает указатель стека на единицу в поле фор регистра со- 
стояния сопроцессора (5мг). Команда не имеет операндов и по своему дей- 
ствию напоминает команду 15+. Содержимое вершины стека при выполне- 
нии команды удаляется; 


1Чес$фр — уменьшает указатель стека на единицу в поле &ор регистра со- 
стояния сопроцессора (5мг). Команда не имеет операндов и по своему дей- 
ствию напоминает команду 4, но операнд в стек не помещается; 


{Ггее $+(1) — освобождает регистр стека $1(1), помечая его как пустой в ре- 
гистре тегов ({мг). Содержимое поля фор в регистре состояния (5\мг) и само 
содержание регистра не изменяются; 


Тпор — команда ничего не делает и может использоваться для временных 
задержек; 


Тзауе 4ез{ — запоминает состояние сопроцессора в 94-байтовой области 
памяти 4е5+ (16-разрядный режим работы) или в 108-байтовой области па- 
мяти (32-разрядный режим работы); 
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® Гг5{ог 5гс — восстанавливает состояние сопроцессора из 94-байтовой обла- 
сти памяти 5гс (16-разрядный режим работы) или из 108-байтовой области 
памяти (32-разрядный режим работы); 


® Г5{епу 45% — сохраняет состояние среды сопроцессора (14 байт для 16-раз- 
рядного режима работы и 28 байт для 32-разрядного режима) в области 
памяти 4е5+. Команда не сохраняет содержимое стека регистров (80 байт); 


® ИП аепу гс — выполняет частичное восстановление состояния среды сопро- 
цессора (14 байт для 16-разрядного режима работы и 28 байт для 32-раз- 
рядного режима) из области памяти $гс. 


Все эти команды обычно требуются при разработке программ с обработчика- 
ми исключительных ситуаций, а также в многозадачной среде, хотя могут ис- 
пользоваться и в обычных приложениях для создания оригинальных алгоритмов 
обработки чисел. 


Интерфейс 
с языками 
высокого уровня 





В процессе разработки программ на языках высокого уровня одной из важней- 
ших проблем, с которой сталкивается разработчик, является производитель- 
ность приложения. Эффективным средством ее повышения является примене- 
ние языка ассемблера для разработки критических участков программного кода 
и оформление их в виде подпрограмм. В этой главе рассматриваются наиболее 
важные аспекты создания интерфейсов подпрограмм на ассемблере и приложе- 
ний, разработанных на популярных языках высокого уровня С++ и Разса|. Необ- 
ходимость разработки отдельной подпрограммы на ассемблере возникает, когда 
тр: Зуется: 
® реализовать какой-то специальный алгоритм, который требует нетриви- 
альной обработки данных и который трудно создать средствами языка вы- 
сокого уровня; 


® обеспечить высокое быстродействие какого-либо алгоритма обработки дан- 
ных или фрагмента программы. 


10.1. Общие принципы построения интерфейсов 


Принципы создания интерфейсов ассемблерных подпрограмм с языками высоко- 
го уровня будем рассматривать применительно к двум наиболее популярным 
инструментам быстрой разработки: Мисгозой У1зиа| С++ МЕТ 2003 и Войапа 
ОерЫ: 2005. В этих пакетах программ в качестве базовых языков программирова- 
ния используются языки С++ (\У150а] С++ МЕТ) и Разса| (Беры 2005), поэтому 
в дальнейшем при ссылках на языки С++ и Разса] будем иметь в виду эти инстру- 
менты разработки. 

Несколько слов о терминологии. Напомню, что в этой главе, как и во всех осталь- 
ных, мы используем термины «подпрограмма» и «процедура» как синонимы. 
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Для компиляции ассемблерных подпрограмм и процедур можно задействовать, 
как и везде в этой книге, макроассемблер МАЗМ версии 6.14-хххх или 7.10.ххлхх. 
Хочу сделать важное замечание: при разработке и анализе программного кода мы 
будем рассматривать только 32-разрядные подпрограммы на ассемблере, то есть 
разработанные с помощью модели памяти {1а+. 

Для написания ассемблерных модулей будет использоваться упрощенный 
синтаксис ассемблера МАЗМ. Это означает, что везде в исходных текстах для 
инициализации логического сегмента данных будет указываться директива даа, 
а для инициализации логического сегмента кода — директива .соде. Что же каса- 
ется области стека, то мы будем работать на стеке вызывающей программы, и от- 
дельная инициализация логического сегмента стека не понадобится. 

При использовании линейной (11а*) модели памяти ближняя (пеаг) и дальняя 
(Гаг) адресация команд и данных не различается, при этом все ссылки в 4-гига- 
байтном адресном пространстве считаются ближними. Это означает, что в проце- 
дурах можно не указывать директивы пеаг и Таг, поскольку компилятор интер- 
претирует все ссылки как ближние (пеаг). 

В примерах этой главы мы будем использовать отдельно скомпилирован- 
ные модули на ассемблере, которые компонуются с программами на С++ МЕТ 
и РерЫ 2005. Эти файлы имеют расширение ОВ) и называются объектными фай- 
лами или объектными модулями. Если подпрограмма будет применяться совме- 
стно с приложением на \У1зиа| С++ МЕТ, то командная строка для компилятора 
МАЗМ выглядит так: 


11 /с /Ро имя_файла.063 имя_файла .азт 


Если подпрограмма на ассемблере будет применяться в приложении, написан- 
ном на Оеры 2005, то командная строка должна выглядеть так: 


® компилятор т] версии 6.14.хххх: 
т] /с /Ро имя файла.06} имя_файла.азт 
® компилятор ш| версии 7.10.хххя: 
11 /с /отЁ /Ро имя_файла.об} имя_файла.азт 


Различия в параметрах связаны с тем, что \У15иа! С++ „МЕТ работает с объект- 
ными файлами в формате СОЕЕ (Соттоп ОБесе Ее Еогта$), а Ое]рН! исполь- 
зует файлы в стандарте ОМЕ (ОБесе Модше Еогта(). Компилятор ассемблера 
версии 6.14 по умолчанию создает объектный файл в формате ОМЕ, в то время 
как компилятор версии 7.10 — в формате СОЕЕ. 

Если во время сборки приложения на Ое!рЬ! появятся сообщения наподобие 
следующих, то это свидетельствует о некорректном формате объектного файла: 


[Еггог] Ргодес!1.арг(15): Е2045 ВаЯ оБдесе Р11е Рогтаф: \...\$и51.06}' 
[Еггог] Ргодес 1 .9рг(11): Е2065 Упзат1$Р1е Рогмага ог ехёегпа1 десТагаф1оп: ‘'$и61*’ 


Второе сообщение является следствием обнаруженной компилятором некор- 
ректности. 

Чтобы избежать подобных ошибок во время сборки программ в ОерЫ, следу- 
ет указывать параметр /от? (версия 7.10 МАЗМ) при компиляции ассемблерной 
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процедуры. Во время компиляции ассемблерных модулей можно использовать 
упрощенный вариант командной строки, например: 


® версия 6.14. хххх 
т] /с имя файла. азт 
® версия 7.10.хххх: 
т] /с /отЁ имя файла. ат 


В этом случае имя объектного файла будет совпадать с именем файла исход- 
ного текста. В процессе сборки проекта в У1зиа| С++ .МЕТ вы можете получить 
предупреждение компоновщика: 


Магп1пд: сопуегё1пд9 обес Рогта{ Ргот ОМЕ то СОЕЕ 


Это предупреждение свидетельствует о том, что ОМЕ-файл будет преобразован 
в формат СОЕЕ, и принципиально оно ничего не меняет, поскольку компилятор 
\У!51а! С++ .МЕТ преобразует ОМЕ-файл в формат СОЕЕ в любом случае. 

Перед сборкой приложения в \У15иа| С++ МЕТ необходимо добавить в проект 
объектный файл с вызываемой процедурой. Лучше всего поместить объектный 
файл с процедурой в рабочий каталог проекта. 

При сборке проекта в ерЫ 2005 следует указать местоположение объектно- 
го файла при помощи директивы 


{Я. путь_к_объектному файлу} 


Более подробно методику включения ассемблерных модулей в проекты мы 
рассмотрим далее в этой главе при анализе примеров. 

Перед разработкой ассемблерных процедур для использования в программах 
на С++ и Разса] остановимся подробно на требованиях, которые должен соблю- 
дать разработчик при создании интерфейса. Их несколько: 


® имена идентификаторов (переменных и процедур), включенных в объект- 
ные файлы, должны соответствовать правилам построения имен данным 
компилятором языка высокого уровня; 


® модель памяти, используемая ассемблерной подпрограммой, должна быть 
линейной (мы рассматриваем только 32-разрядные приложения); 


® способ передачи параметров процедуре должен быть указан в вызывающей 
программе; 


® если вызывающая программа ожидает результат выполнения процедуры, 
то его тип должен быть указан в программе и реально соответствовать то- 
му, который возвращает ассемблерная процедура. 


Рассмотрим требования к интерфейсу более детально и начнем с имен иден- 
тификаторов. Для языка Разса| все строчные буквы в именах внешних идентифи- 
каторов преобразуются в прописные. Компилятор С++ не изменяет регистр букв, 
поэтому имена идентификаторов чувствительны к регистру, что следует учиты- 
вать при разработке процедур. Кроме того, компилятор С++ помещает в имя про- 
цедуры префикс и суффикс в виде определенной последовательности символов. 
Принципы формирования имен в С++ мы рассмотрим далее в этой главе. 
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Способ передачи параметров ассемблерной процедуре должен учитывать сле- 
дующее: 


® параметры в вызываемую подпрограмму передаются либо по значению, ли- 
бо по ссылке. При передаче по значению передается 32-разрядное значение 
операнда, а при передаче по ссылке — его адрес (32-разрядный); 


® параметры в процедуру могут передаваться через стек, регистры или об- 
щую область памяти. Мы будем рассматривать только наиболее распро- 
страненные способы передачи параметров — через стек и регистры. 


Проанализируем более подробно способы передачи параметров через стек 
и регистры процессора. Все они сведены в табл. 10.1. 


Таблица 10.1. Способы передачи параметров 





Директива Передача параметров Очистка стека Использование регистров 
гедгс{ег (Газа!) Слева направо Процедура ЕАХ, ЕОХ, ЕСХ (берН) 
ЕСХ, ЕОХ (Миа! С++ МЕТ) 

расса! Слева направо Процедура Нет 

сдес! Справа налево Вызывающая Нет 

программа 
са! Справа налево Процедура Нет 
закеса!! Справа налево Процедура Нет 


Директивы, указанные в первой колонке слева, называют соглашениями о вы- 
зовах (саШпя сопуепНоп$), соглашениями об именовании или соглашениями о пе- 
редаче параметров. Все эти определения являются синонимами и определяют 
способы взаимодействия программных модулей (в общем случае, разработан- 
ных с помощью разных языков программирования). Любая из этих директив 
определяет: 


® способ передачи параметров в процедуры; 
® способ синхронизации области стека при его использовании процедурой; 


® способ формирования имен и данных для взаимодействия нескольких про- 
грамм и/или пропедур. 


Остальные колонки подробно описывают каждый тип соглашения о вызовах. 

Вторая колонка слева показывает порядок размещения параметров в стеке или 
в регистрах (при передаче параметров через регистры). Например, пусть мнемо- 
ника вызываемой процедуры записывается так: 


Мургос (рагат1. рагат2, рагатЗ) 


Тогда при способе передачи параметров 5&4са11 первым помещается в стек па- 
раметр рагат3, вторым — параметр рагат? и третьим — параметр рагат1. Если, на- 
пример, используется способ передачи параметров гед15{ег, то параметр рагат1 
помещается в регистр ЕАХ, параметр рагатг — в регистр ЕБХ и, наконец, параметр 
рагат3 — в ЕСХ. Более наглядно методику передачи параметров демонстрирует 
рис. 10.1 (для соглашения $%4са11). 
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Этот рисунок демонстрирует еще один очень важный аспект: параметры в сте- 
ке размещаются, начиная с адреса Е5Р+4, поскольку указатель стека ЕЗР содержит 
эффективный адрес (ЕА) команды следующей после вызова са11 пургос. Это дей- 
ствительно для любых способов передачи параметров, использующих стек (разса1, 
сес1, заТеса11), параметры будут находиться в стеке, начиная с адреса ЕЗР+4. 


Область стека 
Младшие адреса Старшие адреса 
ФМ 


Е$Р+4  ЕЗР+8  ЕЗР +12 


Г Га Газ Гек [жа 






тургос (рагат1, рагат2, рагат3) 


о 


«сай 
Рис. 10.1. Вызов процедуры тургос в соответствии с соглашением заса! 


Перед возвращением в основную программу необходимо восстанавливать или, 
как иногда говорят, очищать стек. Речь идет о том, что после завершения процеду- 
ры указатель стека смещается на 4 в сторону увеличения адресов и будет указы- 
вать на ставшие ненужными параметры. Например, после завершения процедуры 
тургос регистр ЕЗР будет указывать на параметр рагат! (рис. 10.2). 


Область стека 
Младшие адреса Старшие адреса 
ды 


ЕЗР+4  Е$Р+8 


О ИИ 


Рис. 10.2. Содержимое стека после завершения процедуры тургос 


Если каждый раз после вызова процедур оставлять стек в таком состоянии, то 
область памяти стека быстро переполнится, что вызовет ошибку и останов про- 
граммы. По этой причине указатель стека нужно очищать. Это можно сделать, 
сместив указатель стека вверх (в сторону увеличения адресов) на величину, опре- 
деляемую количеством занимаемых ненужными параметрами байтов. 

В нашем примере нужно сместить указатель стека на 12 вверх (3 параметра х 
х 4 байта). Такую операцию может выполнить как вызывающая программа, 
так и сама процедура. Способ очистки стека определяется соглашением о переда- 
че параметров (третья колонка слева в табл. 10.1). В случае соглашения $%4са11 
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стек очищает сама вызываемая процедура, для чего в исходный текст включается 
команда геё п, где п — число возвращаемых байтов памяти. Эта команда должна 
быть последней командой процедуры. Для процедуры пургос команда возврата 
должна выглядеть как ге{ 12, хотя вместо нее можно использовать комбинацию 
команд: 

2499 ЕЗР, 12 

ге 

Должен заметить, что вышеуказанные команды не изменяют содержимое яче- 
ек памяти, выделенных под область стека, поскольку это не имеет смысла (при 
следующих обращениях к стеку данные перезаписываются). 

Выбор того или иного способа передачи параметров определяется практиче- 
скими аспектами. Если, например, в программе применяются функции У/1п9д0о\$ 
АР! то стандартным соглашением вызова для них является ${9са11. Директива 
сдес1, например, является стандартной для компиляторов С++ и используется 
ими по умолчанию при вызове процедур из других модулей. 

Наиболее быстрым способом передачи параметров является регистровый 
(гед1зтег). В У15иа| С++ .МЕТ этот способ имеет другое название — Газ{са11. Если 
количество передаваемых в процедуру параметров не превышает трех, то стек не 
используется, что и дает выигрыш в скорости. 

Способ передачи параметров раса] используется в настоящее время редко 
и поддерживается компиляторами в целях обратной совместимости (БасК\’аг@ 
сотраН ИИ), поэтому останавливаться на нем я не буду. 

Вызываемая процедура в большинстве случаев возвращает основной програм- 
ме результат стандартным способом — в регистре ЕАХ. Результатом может быть 
либо непосредственное значение, либо адрес. Во втором случае говорят, что про- 
цедура возвращает ссылку. 

На этом рассмотрение теоретических аспектов построения интерфейсов с язы- 
ками высокого уровня можно закончить и перейти к демонстрации примеров 
взаимодействия процедур на ассемблере с программами на \У15ца!] С++ МЕТ 
и Веры 2005. 


10.2. Интерфейс ассемблерных 
процедур с Веры 2005 


Для демонстрации интерфейса ассемблерных процедур с программами на Оеры 
(и У1зиа! С++ МЕТ) будем использовать простейшие 32-разрядные консольные 
приложения, вызывающие процедуру и отображающие результат ее работы на 
экране дисплея. 

В первом примере вызываемая процедура (она называется ехатр1е1) вычисля- 
ет разность двух целых чисел, передаваемых ей в качестве параметров, и возвра- 
щает результат в регистре ЕАХ в основную программу (листинг 10.1). 
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Листинг 10.1. Вычисление разности двух целых чисел 


.686 

„лодей 1а* 

ор оп сазетар: попе 

„дата 
гез 09 0 

.соде 

ехатр1е1 ргос 
ризН ЕВР 
поу ЕВР. ЕЗР 
Ни 
{119 ога рёг [ЕВР+8] 
{1546 Фмога рёг [Е8ВР+12] 
Е15Ер Ч9могд рёг гез 
моу  ЕАХ. гез 


рор ЕВР 
г 8 
ехатрТе1] епар 
епд 


Здесь процедуре через стек передаются два параметра, представляющие собой 
целые числа. Напомню, что параметры процедуры можно извлечь из стека с по- 
мощью регистра ЕВР. Для этого подготавливаем регистр ЕВР: 

ризй ЕВР 

тоу ЕВР. ЕЗР 

Параметры, передаваемые процедуре ехатр1е1, к этому моменту будут распо- 
ложены в стеке так, как показано на рис. 10.3. 


Область стека 
Младшие адреса Старшие адреса 
д 


ЕЗР Е$Р +4 ЕЗР + 8 Е$Р + 12 


Рис. 10.3. Передача параметров в процедуру ехатр!е1 


Еще один вопрос, который предстоит решить, — какой способ передачи пара- 
метров должна выбрать вызывающая: программа на Пе!рН!. В нашем примере вы- 
берем способ передачи параметров в соответствии с соглашением 5{4са11. В этом 
случае по адресу ЕВР+12 будет находиться правый параметр, а по адресу ЕВР+8 — 
левый (см. рис. 10.3). Далее при помощи следующих команд определяется раз- 
ность двух целых чисел: 

1119 ога рёг [ЕВР+8] 

Е1зиб Фнога рёг [ЕВР+12] 

Результат вычитания, находящийся в вершине стека сопроцессора $1(0), по- 
мещается в переменную гез командой 


115Ер @иог@ рег гез 


10.2. Интерфейс ассемблерных процедур с Веры 2005 257 


Наконец, содержимое гез сохраняется в регистре ЕАХ, и после коррекции стека 
(команда рор ЕВР) происходит выход из процедуры. Поскольку мы приняли со- 
глашение $%9са11, то вызываемая процедура сама должна восстановить указатель 
стека, что и выполняет команда ге{ 8. 

Как вы заметили, нигде в исходном тексте процедуры ехатр1е1 нет упомина- 
ния о соглашении 5%4са11. Следует учитывать, что вызывающая программа не 
проверяет, какое соглашение использует процедура: параметры передаются в со- 
ответствии с директивами, указанными в основной программе. Точно так же вы- 
зывающая программа не проверяет, был ли очищен указатель стека после выхода 
из вызываемой процедуры. По этой причине разработчик должен сам заботиться 
о корректном написании программного кода процедуры. 

Проанализируем теперь программный код вызывающей программы, написан- 
ной на Ое]ры. Исходный текст программы приведен в листинге 10.2. 


Листинг 10.2. Вызывающая программа для процедуры ехатре1 из листинга 10.1 
ргодгат Ргодес*1; 


{ФАРРТУРЕ СО№0ЕЕ} 


и5е5 
$у$0 411$: 


{$1 Е: \ехатр1е1 .053} 
Типс1ой ехатр1е1 (11: 1иедег ;12: 1ищедег) : Тифедег: ${9са11 :ех{егпа1:; 


уаг 
а1. а2: 1педег: 
1гез: [пёедег; 


Бед1п 
а1:= -1601: 
а2:= -8892; — 
1гез:= ехатр1е1(а1. а2):; 
Иг бе ( Ти То5Ег(1ге$)); 
ейд. 


В этом листинге хочу обратить внимание на несколько ключевых моментов. 


Прежде всего, следует указать компоновщику путь к объектному модулю, в кото- 
ром находится процедура ехатр1е1. Эти действия выполняет директива 


{$1 Г. \ехатр1е1 .06}} 


Хочу также заметить, что имя процедуры и имя объектного файла выбраны 
совпадающими для удобства, в общем случае они могут различаться. 

Далее, нужно объявить вызываемую процедуру как внешнюю (ехёегпа]) и ис- 
пользующую соглашение о вызовах 5%4са11. Кроме того, следует указать парамет- 
ры и их тип, а также тип возвращаемого внешней процедурой значения. Эти дей- 
ствия выполняет директива 


ТипсёЛоп ехатр1е1(11: 1п*едег: 12: 1и{едег) ; Тифедег: $&9са11 :ехфегпа] ; 
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Здесь указано, что процедура возвращает результат (ключевое слово Рипсё1оп), 
что она принимает два целочисленных параметра, 11 и 12, а также то, что возвра- 
щаемое значение является целым числом. 

В соответствии с этим объявлением процедуры в вызывающей программе, 
процедура ехатр1е1 извлекает параметр 11 по адресу ЕВР+8, а параметр 12 — по 
адресу ЕВР+12 (см. листинг 10.1). Результат выполнения процедуры ехатр1е] чис- 
ленно равен 11 - 12. 

Остальная часть программы на Веры обеспечивает инициализацию перемен- 
ных и вызов процедуры ехатр1ег: 

а1:= -1601: 

аг:= -8892: 

1ге$:= ехатр1е1(а1. а2); 

После выполнения этих операторов целочисленная переменная 1гез будет 
содержать значение 7291, которое преобразуется к строковому типу функцией 
ГПЕТо${г(1гез) и выводится на экран посредством оператора \г1 ел. 

В этом примере при вызове процедуры ехатр1е1 было использовано соглашение 
${Чса11. Посмотрим, как изменятся вызывающая программа и процедура ехатр1е1, 
если в качестве соглашения об именовании принять с4ес1. Что касается процеду- 
ры ехатр1е1, то здесь произойдет только одно изменение — команда возврата из 
процедуры геё будет использоваться без параметров; этот фрагмент кода вы- 
глядит так: 

„Дафа 

гез 000 


.соде 
ехатр1е1 ргос 


ге 
ехатр1е1 епар 
епд 


В вызывающей программе на Ое]рН в строке объявления процедуры ехатр1е1 
следует заменить директиву $14са11 на сдес1: 


фипс Той ехатр]е1(11: [педег: 12: 1п*%едег) : Тифедег: сдес1 :ехфегпа1 : 


Как видим, изменения в исходных текстах минимальны. Рассмотрим теперь 
самый быстрый способ передачи параметров, использующий соглашение гед1${ег. 
В этом случае в вызывающей программе изменения также оказываются мини- 
мальными, и касаются они объявления процедуры ехатр1е?: 


РипсЕТоп ехатр1е3(11: Титедег; 12: [{итедег) : [пёедег; гед1 $фег: ехёегпа] : 


Исходный текст процедуры ехатр1е!1 при использовании соглашения гед1${ег 
намного упрощается (листинг 10.3). 


Листинг 10.3. Модифицированный вариант процедуры ехатре1 для соглашения гед(%ег 
.686 

.тоЧе? Т1а& 

ор&1оп сазетар: попе 

.соде 
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ехатр1еЗ ргос 
зи6 ЕАХ. ЕОХ 
геф 
ехатр1е3 епдр 
епд 


Поскольку параметры в процедуру при данном соглашении передаются через 
регистры, то для вычисления разности 11 - 12 нужно выполнить команду 


$и6 ЕАХ, ЕОХ 


Напомню, что соглашение гед15%ег (см. табл. 10.1) предполагает размещение 
левого параметра (11) в регистре ЕАХ, а правого (12) — в регистре ЕБХ. Поэтому ре- 
зультат можно получить при помощи всего одной команды — $46. Поскольку ре- 
зультат вычитания остается в регистре ЕАХ, то на этом процедура ехатр1е1 работу 
заканчивает. Как видно, для такого метода передачи параметров требуется мень- 
шее число команд, поскольку не нужно обращаться к области стека и, кроме того, 
регистровые операции требуют меньше машинных циклов. По этой причине ме- 
тод вызова процедур с использованием регистров является очень быстрым. 

До сих пор мы рассматривали работу процедур, возвращающих в регистре ЕАХ 
определенное значение. Намного чаще в вызывающую программу возвращается 
не сама переменная, а ее адрес. В этом случае говорят, что процедура возвращает 
ссылку. При помощи ссылки можно обращаться к строкам и массивам, что значи- 
тельно расширяет область применения ассемблерных процедур. 

В следующем примере процедура (назовем ее ехатр1е?) вычисляет разность 
двух чисел с плавающей точкой, являющихся ее параметрами, и возвращает адрес 
результата в вызывающую программу (листинг 10.4). При вызове процедуры ис- 
пользуется соглашение $449са11. 


Листинг 10.4. Вычисление разности двух чисел с плавающей точкой 


.686 
.тоде] ТТаф 
орё1оп сазетар: попе 
„ата 
гез 000 
.соде 
ехатр1е2 ргос 
ризй ЕВР 
тоу ЕВР. ЕЗР 
{111% 
#4 дога рег [ЕВР+8] 
Тзиь Фмога р®г [ЕВР+12] 
Т5фр Чмога рёг гез 
Теа ЕАХ. гез 
рор ЕВР 
геё 8 
ехатр1е2 епар 
епд 


Во многом исходный текст процедуры ехатр1е? напоминает программный код 
процедуры ехатр1е] из листинга 10.1, поэтому остановлюсь только на изменени- 
ях. Во-первых, здесь используются команды математического сопроцессора для 
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операций над числами с плавающей точкой, во-вторых, вместо значения в регист- 
ре ЕАХ возвращается адрес переменной гез, содержащей разность вещественных 
чисел (команда 1еа ЕАХ. ге). 

Код вызывающей программы на Веры показан в листинге 10.5. 


Листинг 10.5. Вызывающая программа для процедуры из листинга 10.4 
ргодгат Ргодес1: 


{ЗАРРТУРЕ СОМЗОЕЕ} 


и5е5 
5у$04115$: 


{$4 Е: \ехатр1е2 .о5}} 
ТипсёТой ехатр1е2(х1:5$1п91е;х2:$1па1е) :Р51пд1е:${4са11 ; ехёегиа!; 


уаг 
Ь1. 52: $1п91е; 
{гез: Р51иа]е: 


Бед1п 
Ы] := -23.78: 
52:= -45.09; 
1гез:= ехатр1её(Ь1. 52); 
Игл хер и(ЕТоаТо$г( Ргез^)); 
епа 

Прежде всего, нужно указать компоновщику Оеры, где находится объектный 
файл с процедурой ехатр1е2, что выполняется директивой 

{$1 Е: \ехатрТеё.о6} } 

Далее объявляется процедура ехатр1е2 с соответствующими атрибутами: 

Типсётоп ехатр1е2(х1:51и91е:х2: 51п91е) : Р51пд1е; $&9са11 :ехфегпа]; 

Параметрами этой функции выступают числа с плавающей точкой в коротком 
(51п91е) формате х1] и х2. Процедура возвращает указатель (Р51п91е) на результат 
вычитания х!1 из х2. Остальные атрибуты ($14са11 и ехфегпа1) мы рассматривали 
ранее, поэтому останавливаться на них я не буду. 


Исходный текст процедуры несложен, но я хочу обратить внимание на два 
оператора: 


{гез:= ехатр1Те2(51. 52); 
Игтсет(ЕТоаЕТо5+г(1ге5^)): 


Первый оператор запоминает адрес результата в переменной-указателе {гез, 
а второй выполняет несколько действий: 
1. Разыменовывает указатель {гез, то есть извлекает значение по указанному 
адресу (оператор ^). 
2. Преобразует полученное число в формате плавающей точки в строку сим- 
волов (функция ЕР] оа&То5+г). 


3. Выводит результат операции на экран дисплея (функция Иг1\{е[л). 
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При указанных значениях переменных 51 и 52 результат, выводимый на экран 
дисплея, будет равен 21,31. 


10.3. Интерфейс ассемблерных процедур 
с Миа! С++ .МЕТ 2005 


Проанализируем, как будет выглядеть интерфейс ассемблерных процедур с про- 
граммами, написанными на \У1зиа| С++ МЕТ. Воспользуемся исходными тек- 
стами процедур ехатр1е1 и ехатр1еёг, рассмотренными в предыдущем разделе, 
для демонстрации принципов построения интерфейса с программами на У15а| 
С++ МЕТ. 

В первом примере при помощи процедуры ехатр1е1 вычислим разность двух 
целых чисел и отобразим результат операции на экране дисплея. Предположим, 
что процедура использует соглашение 5&4са11. В этом случае исходный текст про- 
цедуры ехатр1е1 останется практически без изменений, но потребуется внести 
коррективы в имя процедуры: добавить в начале имени символ подчеркивания, 
а в конце имени — суффикс @и, где п — число байтов, необходимое для передачи 
параметров. Подобная форма именования соответствует требованиям компиля- 
тора С++ для соглашения $%4са11. С учетом этих изменений исходный текст про- 
цедуры ехатр1е1 будет таким, как показано в листинге 10.6. 


Листинг 10.6. Модифицированная версия процедуры ехатр!е1 для работы с С++ .МЕТ 
(соглашение са!) 


‚686 
.тоде] 1Та% 
орё1оп сазетар: попе 
.даба 
гез 000 
.соде 
_@хатр1е1@8 ргос 
ризй ЕВР 
оу ЕВР. ЕЗР 
11116 
1114 ога рег [ЕВР+8] 
{15и6 Чмога рёг [ЕВР+12] 
115р дога рег гез 
оу  ЕАХ, гез 
рор ЕВР 
ге 8 
_ехатр1е1@8 епар 
епа 


Обратите внимание на способ формирования имени ассемблерной процедуры 
(_ ехатр1е1@8) — он соответствует требованиям соглашения $%4са11. 

Вызывающая программа на \У15иа| С++ МЕТ будет такой, как показано в ли- 
стинге 10.7. 
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Листинг 10.7. Вызывающая программа для процедуры из листинга 10.6 


НИисТиде <5910.1> 
ехбегпт "С" 1пё __ $69са11 ехатр1е1 (1иё 11. 116 12); 
17% ма1и(\019) 
{ 
116 1] = 455: . 
16 12 = -743; 
реТиЕР("“ЕХАМРЕЕ1: %4\п", ехатр1е1{11, 12)); 
гебигп 0; 


} 
В этой программе процедура ехатр1е1 объявлена следующим образом: 
ехреги “С” 1тё __ 5%49са11 ехатр1е1(1пё 11, 1пё 12): 


Здесь ключевое слово ех{егп указывает на то, что процедура ехатр1е1 является 
внешней, директива __$14са11 устанавливает соглашение об именовании и, кроме 
этого, требует формирования имени вызываемой процедуры специальным обра- 
зом (как было показано ранее). 

Должен заметить, что для компилятора \1виа1 С++ МЕТ соглашением об име- 
новании по умолчанию является с4ес1, поэтому указывать его необязательно. 
Любое другое соглашение (5{4са11, Та5%са11) необходимо указывать явным обра- 
зом при объявлении внешней процедуры. Двойное подчеркивание при задании 
соглашения об именовании обязательно. 

Оператор "С" предотвращает декорирование имени процедуры. Этот параметр 
имеет смысл только для компилятора С++, и мы не будем на нем останавливать- 
ся — достаточно помнить, что в объявлении процедуры присутствие оператора 
"С" необходимо. 

Смысл входных параметров процедуры, а также возвращаемого значения по- 
нятен и в объяснениях не нуждается. При указанных значениях переменных 11 
и 12 результат равен 1198. 

Модифицируем предыдущий пример так, чтобы вызываемая процедура ис- 
пользовала соглашение об именовании с4ес1. Для этого в исходном тексте про- 
цедуры ехатр1е1 следует изменить имя процедуры, чтобы оно удовлетворяло 
соглашению сдес1 — в начале имени должен присутствовать символ подчерки- 
вания, в то время как оставшаяся часть остается неизменной. Кроме того, в ис- 
ходном тексте процедуры команду гей нужно указать без параметров. Модифици- 
рованный вариант процедуры ехатр1е1, удовлетворяющий соглашению с4ес1, 
представлен в листинге 10.8. 


Листинг 10.8. Модифицированная версия процедуры ехатр/е1, использующая 
соглашение сдес! 


.686 
„ое! Наф 
орё1оп сазетар: попе 
„Чата 
гез 000 
. соде 
_ехатр1е1 ргос 
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ризй ЕВР 

тоу ЕВР. ЕЗР 

{1116 

+ТТа ога рег [ЕВР+8] 
{15и6 дога рёг [ЕВР+12] 
1156р ога рёг гез 

оу  ЕАХ. гез 


рор  ЕВР 

ге 
_ехатр1е] епар 
еп4 


Программный код вызывающей программы на У\15ща| С++ МЕТ показан в ли- 
стинге 10.9. 


Листинг 10.9. Вызывающая программа для процедуры из листинга 10.8 


ЗИпсТиде <5Е910.1> 
ехфегп "С" 11 ехатр1е1(1пё 11. 1ё 12): 
118 ма?п(у019) 


{ 

116 11 = 45; 

16 12 = -73; 

рг1иё + ("ЕХАМРЫЕ]: ФА\п“. ехатр1е1 (11. 12)): 
гебигп 0: 


} 

Обратите внимание на объявление внешней процедуры ехатр1е1. Здесь отсут- 
ствует явное указание соглашения о передаче параметров, поскольку по умолча- 
нию используется соглашение сдес1. 

Проведем анализ самого быстрого способа передачи параметров — Та+са11. 
В соответствии с табл. 10.1 первые два параметра в вызываемую процедуру пере- 
даются слева направо с помощью регистров ЕСХ и ЕДХ, а остальные — справа нале- 
во через стек. Кроме того, имя вызываемой процедуры при таком соглашении 
должно формироваться следующим образом: в начале имени процедуры ставится 
знак амперсанда (@), а в конце — сочетание символов @и, имеющее тот же смысл, 
что и для соглашения ${9са11. Исходный текст процедуры ехатр1е1, удовлетво- 
ряющий соглашению {а$1са11, показан в листинге 10.10. 


Листинг 10.10. Модифицированная версия процедуры ехатр/е1, использующая 
соглашение Разса! 


.686 

„тодеТ +]а& 

орЕ1оп сазетар: попе 

.соде 

@ехатр1е168 ргос 
моу  ЕАХ. ЕСХ 
5и6  ЕАХ, ЕОХ 
ге 

@ехатр1е1@8 епар 
епа 


Вызывающая программа на \15ца| С++ МЕТ показана в листинге 10.11. 
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Листинг 10.11. Вызывающая программа для процедуры из листинга 10.10 
ЗАисТиде <$%410.1> 

ехбегп "С" 1пЁ _ Та$са11 ехатр1е1(1ие 11. 16 12): 

11 ма1п(у01а) 


116 11 = 145; 

116 12 = -203; 

ргЧпЕ("ЕХАМРЕЕ]: %@\п". ехатр1е1(11. 12)): 
гебиги 0: 


} 


До сих пор все рассматриваемые версии процедуры ехатр1е1 возвращали в вы- 
зывающую программу непосредственное значение. Сейчас мы проанализируем 
пример процедуры, возвращающей не значение переменной, а указатель на значе- 
ние (адрес). В листинге 10.12 приводится исходный текст процедуры ехатр1ег, 
вычисляющей разность двух чисел с плавающей точкой, которые являются вход- 
ными параметрами для этой процедуры. Процедура возвращает в регистре ЕАХ ад- 
рес результата. Будем полагать, что для процедуры ехатр1е2 принято соглашение 
об именовании $19са11. 


Листинг 10.12. Вычисление разности двух чисел с плавающей точкой 


.686 
„тоде] 11 а% 
орТоп сазетар:попе 
.Чафа 
гез 000 
.соде 
_ехатр1е288 ргос 
ризв ЕВР 
поу ЕВР. ЕЗР 
11116 
{14 Чмога рег [ЕВР+8] 
ТЗиБ дога рег Г[ЕВР+12] 
Т5фр Фмога рёг гез 


]1еа ЕАХ. гез 
рор ЕВР 

геё 8 
_ехатр1е2@8 епар 
епа 


Программный код вызывающей программы на \У15ща| С++ МЕТ показан в ли- 
стинге 10.13. 


Листинг 10.13. Вызывающая программа для процедуры из листинга 10.12 
ННисТи4е <$%4910.П> 

ехёегп "С" Роа%* __${9са11 ехатр1е2(Р]оаЕ +1. ГТоаф #2); 

116 та1и(уо1а) 


Поаф 11 = 1.45: 

ТТоаЕ {2 = -2.03; 

рг1иЕ{( "\пЕХАМРЕЕ2: %5.21\п", *ехатр1е2(11. 12)); 
гевигп 0; 


} 
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Хочу обратить внимание читателей на то, как обрабатываются ссылки в \У!5а| 
С++ МЕТ. Рассмотрим объявление процедуры ехапр1е2: 


ехфеги "С" Поа* __59са11 ехатр1е2(+1оа% +1. Роаё +2): 


В этом объявлении указатель на число с плавающей точкой в коротком фор- 
мате декларируется как 11оа1*. Для получения значения числа и вывода его на 
экран дисплея следует разыменовать указатель, для чего используется оператор 
разыменования *, который должен помещаться перед указателем. Следующий 
оператор С++ демонстрирует это: 


рг1иЕ 1 ("\пЕХАМРЕЕ?: %5.21\п", *ехатр1е2(11. 12)): 


Процессоры 
[те| Репйит 

в современных 
разработках 





Эта глава посвящена анализу вычислительных возможностей последних поколе- 
ний процессоров Пе! Репйит для платформы ГА-32, которые получили широ- 
кое распространение как в промышленных системах, так и в домашних персо- 
нальных компьютерах. Мы рассмотрим особенности использования процессоров 
Ге! Реп ит 4 и начнем с обзора микроархитектуры М№е{Вигз&, на которой и бази- 
руется это поколение процессоров. 


11.1. Микроархитектура пе! Ме ВигЕ 


Основные особенности №еёВиг$Е: 


гиперконвейерная (Бурег-р!рейпед) технология; 
применение кэша трассировки выполнения команд (ехесиНоп &гасе саспе); 
повышенная частота (400 МГц) системной шины; 


улучшенная схемотехническая и аппаратная реализация модулей целочис- 
ленных арифметических операций (гар! ехесийоп епёште); 


использование специального алгоритма улучшенного динамического вы- 
полнения команд (адуапсей дупапс ехесийоп); 


использование потокового $5Е2-расширения; 
улучшенный кэш передачи данных (адуапсе4 {гапз{ег сасБе); 


аппаратная реализация блока предварительной выборки (выборки с упре- 
ждением) команд (Баг4\аге ргеесфег). 


Рассмотрим особенности Ме Вигз{ более подробно: 


В гиперконвейере команд используется 20-ступенчатая выборка, что в два 
раза превышает глубину очереди для процессоров линейки Р6б. Это позволяет 
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обеспечивать высокую производительность и, кроме того, способствует 
дальнейшему увеличению тактовой частоты. 


Кэш трассировки выполнения команд обеспечивает принципиально но- 
вую реализацию кэша команд 1-го уровня. Он кэширует команды процес- 
сора (микрооперации), устраняя задержки, создаваемые декодером команд 
(шсгасЧоп 4есо4ег). Кроме того, кэш трассировки выполнения команд со- 
храняет результаты ветвлений в одной и той же линейке кэша, что позво- 
ляет повышать скорость передачи команд из кэша и приводит к лучшему 
использованию пространства памяти, который он занимает (12 К микро- 
операций). В общем итоге применение кэша трассировки позволяет увели- 
чить количество инструкций, обрабатываемых исполнительными модуля- 
ми процессора, и уменьшить время восстановления очереди команд после 
неправильно спрогнозированных переходов. 


Частота обмена данными 400 МГц вместе с интерфейсом системной ши- 
ны и схемами умножения позволяет обеспечивать прием/передачу данных 
в процессор на скорости, превышающей 3,2 Гбайт/с. 


Улучшенная схемотехническая и аппаратная реализация модулей целочис- 
ленных арифметических операций обеспечивает работу арифметико-логи- 
ческих модулей (Агфтейс Товс Опиз, АШО5) центрального процессора. 
на частоте, превышающей в два раза частоту базового кристалла процессо- 
ра. Это позволяет выполнять некоторые инструкции за половину такта 
частоты процессора, что в общем итоге приводит к повышению производи- 
тельности и уменьшению задержек при выполнении команд. 


Специальный алгоритм улучшенного динамического выполнения команд 
обеспечивает спекулятивное (условное) выполнение инструкций процессора 
в окне (буфере памяти), содержащем до 126 инструкций. Такой большой 
размер окна позволяет избегать задержек при выполнении инструкций, 
ожидающих результатов выполнения других команд (например, команд 
получения данных из памяти), за счет изменения порядка выполнения на- 
ходящихся в этом окне инструкций. В общем итоге это повышает загрузку 
центрального процессора. Технология улучшенного динамического выпол- 
нения команд обеспечивает более совершенное предсказание ветвлений, 
что уменьшает ошибки предсказаний приблизительно на 33 % по сравне- 
нию с архитектурой Рб. Это достигается не в последнюю очередь и за счет 
использования буфера предсказаний (ВгапсВ Тагяе Вийег, ВТВ) размером 
4 Кбайт, который позволяет сохранять более детальную историю уже вы- 
полненных ветвлений. 


Микроархитектура Ме Виг$( расширяет возможности технологий ММХ 
и 55Е за счет добавления 144 новых команд потокового $5Е2-расширения, 
предназначенных для выполнения операций над 128-разрядными целочис- 
ленными данными и данными с плаваюнгей точкой двойной точности. Новые 
команды обеспечивают более высокую производительность при разработке 
программ для процессора ие] РепНит 4. Использование 5$$Е2-расширения 
значительно повышает производительность приложений. Мы будем рас- 
сматривать практические аспекты применения технологии 55Е2 в главе 14. 
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® Улучшенный кэш передачи данных — это вспомогательный кэш размером 
256 Кбайт, поддерживающий высокоскоростной канал передачи данных 
между кэшем 2-го уровня и процессором. Он включает в себя 256-разряд- 
ный (32-байтовый) интерфейс, выполняющий передачу данных за один 
такт частоты процессора. Предположим, что процессор ие] РепНит 4 рабо- 
тает на частоте 2,4 ГГц. В этом случае скорость передачи данных достигает 
76,8 Гбайт/с (32 байта х 2,4 ГГц = 76,8 Гбайт/с). Использование такого кэ- 
ша обеспечивает высокий процент загрузки центрального процессора. 


® При аппаратной реализации блока предварительной выборки (выборки 
с упреждением) команд, впервые реализованной в процессорах Пе! Реп- 
ит 4, этот блок представляет собой отдельный аппаратный модуль процес- 
сора, прозрачный по отношению к выполняемым программам. Он обеспе- 
чивает упреждающую выборку команд на основе анализа вычислительного 
алгоритма программы. Такое решение позволяет снижать задержки при об- 
ращении к оперативной памяти в процессе выполнения программы, что по- 
вышает производительность работы приложения. 


11.2. Особенности работы приложений 
с процессором те! Репёит 4 


Производительность выполнения приложений для процессоров, работающих на 
высоких частотах, может варьироваться в значительных пределах. Это связано, 
главным образом, с тем, что для каждого приложения пишется свой уникальный 
программный код. Диапазон разрабатываемых приложений весьма широк: от 
простых офисных программ до сложных мультимедийных проектов. 

Одним из показателей производительности программ является количество 
команд, или инструкций, процессора, выполняемых в единицу времени. Этот по- 
казатель в значительной степени зависит от числа условных переходов и ветвле- 
ний в программе, а также от предсказуемости этих переходов и ветвлений. Чем 
больше программный код содержит непредсказуемых или плохо предсказуемых 
ветвлений, тем больше времени процессор будет тратить на бесполезную работу. 
Например, в приложениях, интенсивно обрабатывающих целые числа, а также 
в офисных приложениях, таких, как текстовые процессоры, обычно выполняется 
много переходов и ветвлений, что снижает производительность их работы. 

В общем случае, производительность выполнения приложений с большим чис- 
лом ветвлений не зависит линейно от частоты используемого процессора и меня- 
ется относительно медленно, несмотря на архитектурные улучшения современ- 
ных процессоров, такие, например, как многоступенчатые конвейеры команд. 

В то же время в мультимедийных приложениях, а также в приложениях, в ко- 
торых выполняются в основном операции над числами с плавающей точкой, 
ветвления и переходы, как правило, предсказуемы с высокой степенью вероятно- 
сти. По этой причине такие приложения показывают более высокую производи- 
тельность по сравнению с целочисленными и офисными приложениями. 
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Для мультимедийных приложений, как и для приложений, оперирующих числа- 
ми с плавающей точкой, зависимость производительности от частоты процессора 
практически линейна, и, кроме того, здесь ощущается преимущество процессоров 
с большей глубиной конвейера команд. Процессор [те] Репиит 4 позволяет повы- 
сить производительность работы приложений, хотя и в разной степени, в зависи- 
мости от рассмотренных выше условий. В общем случае, переход от процессо- 
ров с предыдущей микроархитектурой, например пе! Репбит Ш, к процессору 
Пуе! Репиитм 4 не повышает производительность работы приложений во столько 
же раз, во сколько возрастает частота процессора. 

Для того чтобы воспользоваться преимуществами архитектуры новых процес- 
соров, таких, как ие! РепЧит 4, можно перекомпилировать приложение при по- 
мощи более новой версии компилятора либо задействовать оптимизированные 
библиотеки функций для работы с мультимедийными ММХ-, $5Е- или 55Е2-рас- 
ширениями. В общем, оптимизация приложений для процессоров те] Репцит 
может идти в трех направлениях: 


® конвейеризация и буферизация памяти; 
® разработка эффективных вычислительных алгоритмов; 
® эффективное использование системной шины. 


В следующих главах мы акцентируем внимание на разработке эффективных 
алгоритмов обработки данных с использованием технологии 51 МО, а точнее — 
ММХ-, 55Е- и $5Е2-расширений процессоров Пие| Репит. 


ММХ-расширение 
процессоров ше 
Репйит 





Материал этой главы открывает обзор наиболее мощных технологий обработки 
данных, разработанных фирмой Пи и поддерживаемых последними поколения- 
ми процессоров Репнит. Эта группа технологий известна под названием $1МО 
(ше шягисйоп, МШире Раёа — одна команда, много данных). Технологии 
У1МР представляют собой расширения базовой архитектуры ГА-32 процессоров 
ие! и включают в себя дополнительные регистры, типы данных и команды. Ос- 
новная цель включения этих расширений в архитектуру пе! — добиться более 
высокой производительности работы мультимедийных приложений, а также си- 
стем обработки и передачи данных. В практическом плане 31МР реализована как 
две взаимосвязанные технологии обработки данных: 


® с помощью технологии ММХ (МииМефа еХепзюп$ — мультимедийные 
расширения) выполняется высокоэффективная обработка данных целочис- 
ленного типа, имеющих разрядность 64 бита; 


» технология ЗЕ (Згеапипа $1МР Ежепзюп$ — потоковые $1 МО-расшире- 
ния) предназначена для эффективной обработки данных вещественного 
типа с разрядностью 128 бит. 


Эти технологии позволяют разработать высокопроизводительные приложе- 
ния при решении следующих задач: 


» кодирование, декодирование и обработка сигналов; 
» распознавание речи; 

® обработка и захват видеосигналов; 

» манипулирование объектами ЗО-графики; 

® обработка ЗР-звука; 

» промышленное проектирование (САР/САМ). 


Главное преимущество архитектуры $1МР заключается в том, что многие вычис- 
ления можно выполнять одновременно или, как говорят, параллельно над несколь- 
кими операндами, что позволяет увеличить быстродействие программного кода. 
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Применение ассемблера в $ МО-расширениях позволяет писать компактный 
и быстрый код для критических фрагментов приложения с использованием спе- 
циальных инструкций процессора для $1МО-расширений. 

Материал этой главы посвящен анализу операций ММХ-расширения, позво- 
ляющего обрабатывать целочисленные данные параллельно. Несмотря на широкое 
распространение, которое получила технология ММХ, информация, касающаяся 
практических аспектов ее применения, во многих случаях не систематизирована 
или отрывочна. Представленный в этой главе материал призван восполнить этот 
пробел. Здесь вы найдете довольно подробную информацию о данной техноло- 
гии и о ее применении, но вначале проанализируем некоторые принципиальные 
вопросы реализации технологии ММХ. 

В основе технологии ММХ лежит расширение набора команд процессора с уче- 
том потребностей современных мультимедийных программ. Команды техноло- 
гии ММХ работают с новыми типами данных: 64-разрядными целочисленными 
данными, а также с данными, упакованными в группы общей длиной 64 бита. 
Такие данные могут находиться в памяти или в восьми ММХ-регистрах, которые 
обозначаются как ММО — ММУ. 

Технология ММХ расширяет функциональные возможности процессоров ар- 
хитектуры Ги! при полной совместимости с программами, написанными для пре- 
дыдущих поколений процессоров. Все подобные программы безо всяких измене- 
ний могут выполняться на процессорах, поддерживающих технологию ММХ. 

Команды ММХ-расширения выполняются так же, как и команды с плаваю- 
щей точкой. Более того, механизм сохранения и восстановления состояния вы- 
числительной среды, принятый для операций с плавающей точкой, применим 
и при выполнении ММХ-вычислений. Технология ММХ не требует какого-то 
специального режима работы процессора или дополнительных аппаратных ре- 
сурсов — команды ММХ-расширения выполняются в том же режиме процессора, 
что и комапды с плавающей точкой. 

Команды ММХ-расширения обеспечивают параллельную обработку несколь- 
ких байтов, слов или двойных слов, а также поддерживают работу со следующи- 
ми типами данных: 


» упакованные байты (раске4 Буе) — один 64-разрядный регистр содержит 
8 байт (рис. 12.1); 


63 15 70 


СЕТЕ Т] 


Рис, 12.1. 8-байтовый формат представления данных 


» упакованные слова (расКе4 \от4) — один 64-разрядный регистр содержит 
четыре 16-разрядных слова (рис. 12.2); 


63 15 0 


О О ПО ОИ 


Рис, 12.2. Формат представления данных в виде четырех слов 
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» упакованные двойные слова (раскед доц е\ога) — один 64-разрядный ре- 
гистр содержит два 32-разрядных слова (рис. 12.3); 


63 31 0 


О ПО 


Рис. 12.3. Формат представления данных в виде двух двойных слов 


» 64-разрядные слова (диа\ота) (рис. 12.4). 
63 0 


Е 


Рис. 12.4. Формат представления данных в виде учетверенного слова 


При работе с ММХ-командами используются регистры стека математическо- 
го сопроцессора 80 — 87. При этом вместо 80 бит задействуются 64, а стековая 
организация, требуемая для операций сопроцессора, не используется. Регистро- 
вый стек в операциях ММХ-расширения рассматривается как группа из восьми 
независимых 64-разрядных регистров (рис. 12.5). 


Стек регистров сопроцессора ММХ-регистры 
79 63 0 63 0 
Ко — мо 
К1 — м1 
К2 —» М2 
[< — ммз 
4 — мм4 
5 —> ММ 
Кб — мм 
7 —> М7 


Рис. 12.5. Соответствие регистров сопроцессора и ММХ-расширения 


Хочу упомянуть одно важное правило, которое следует соблюдать при совме- 
стном использовании математического сопроцессора и ММХ-расширения: послед- 
ней выполняемой командой ММХ-расширения должна быть команда еттз. 

Дело в том, что все ММХ-команды выполняются в том же режиме процессора, 
что и команды с плавающей точкой, что вызывает изменения содержимого реги- 
стра состояния (5мг) сопроцессора. Команда еттз обеспечивает корректный пере- 
ход процессора от выполнения фрагмента программного кода с ММХ-командами 
к обработке обычных команд с плавающей точкой. При этом еттз устанавливает 
значение 1 во всех разрядах регистра состояния. Если фрагмент программы, в.ко- 
тором есть ММХ-команды, не заканчивается командой етих, то все последующие 
операции с плавающей точкой будут давать некорректные результаты, о чем сиг- 
нализирует исключение З(асК оуегЙо\м. 
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Большинство команд ММХ-расширения имеют следующий синтаксис: 
имя команды приемник. источник 


Здесь приемник — это выходной операнд, или операнд-приемник, а источник — 
входной операнд, или операнд-источник. Обычно входная информация извлека- 
ется из обоих операндов, а результат записывается в выходной операнд. 

Обработка данных ММХ-расширения может выполняться одним из двух спо- 
собов; с использованием либо циклической арифметики (\гарагоип4 агБ тес), 
либо арифметики с насыщением (забигаНоп атиБтейс). Большинство команд 
технологии ММХ обрабатывают данные по правилам циклической арифметики, 
а некоторые команды задействуют арифметику с насыщением. 

Если команда задействует циклическую арифметику (другое название — 
арифметика с циклическим переносом) и результат операции выходит за двоич- 
ную разрядную сетку используемого типа данных, то «лишние» старшие биты ре- 
зультата отбрасываются. Иначе говоря, если результат превышает максимально 
возможное значение на п единиц, то результатом считается минимальное значе- 
ние плюс п и минус 1. Например, сложение байтов 01В и РЕВ дает 00В. 

Если команда использует арифметику с насыщением и результат операции 
превышает максимальное представимое значение, то в выходной операнд запи- 
сывается это максимальное значение (происходит «насыщение»). Аналогично, 
если результат операции оказывается меньше нижней границы допустимого диа- 
пазона, то в выходной операнд записывается минимальное возможное значение. 
Например, если результат меньше 8000}, то 16-разрядное слово со знаком счита- 
ется равным 80001. Если полученное значение больше 7ЕЕЕБ, то слово со знаком 
считается равным 7ЕЕЕБ. 

В арифметике с насыщением ММХ-команды сложения, вычитания и упаков- 
ки данных могут обрабатывать числа со знаком или без знака. Данные со знаком 
и без знака имеют различный допустимый диапазон. Следовательно, если исполь- 
зуется арифметика с насыщением, то при выходе результата операции за пределы 
допустимого диапазона в выходной операнд записываются различные значения, 
в зависимости от типа данных. Например, если результат превышает 7ЕЕЕВ, сло- 
во со знаком считается равным 7ЕЕЕБ, а слово без знака — нет. 

Вернемся к анализу синтаксиса ММХ-команд. Большинство команд имеют 
суффикс, который определяет тип данных и используемую арифметику: 


® из (ипявпед засигаНоп) — арифметика с насыщением, данные без знака или, 
по-другому, беззнаковое насыщение. Если команда использует арифмети- 
ку с насыщением и результат операции превышает максимальное предста- 
вимое значение, то в выходной операнд записывается это максимальное 
значение (происходит «насыщение»). Аналогично, если результат опера- 
ции оказался меньше нижней границы допустимого диапазона, то в выход- 
ной операнд записывается минимально возможное значение; 


® ЗИЛИ 5$ (515164 забигаНоп) — арифметика с насыщением, данные со знаком 
или, по-другому, знаковое насыщение; 


“ 
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» если в суффиксе нет ни символа $, ни символов $$, то применяется цикли- 
ческая арифметика (\тгарагоипа). Если в этом случае результат операции 
выходит за двоичную разрядную сетку используемого типа данных, то 
«лишние» старшие биты результата отбрасываются; 


® В, и, 9, 9 — эти буквы указывают тип данных. Если в суффиксе есть две из 
этих букв, первая соответствует входному операнду, вторая — выходному. 


Вот некоторые примеры. Следующая команда выполняет сложение слов без 
знака: 


раддизи ММО .тет1 


Здесь суффикс из означает, что в команде используется арифметика с насыще- 
нием без знака, а операнды имеют разрядность слов. Первое слагаемое находится 
в ММХ-регистре ММО, а второе -—- в памяти по адресу тет1. Результат сохраняется 
в регистре ММО. 

Еще один пример: 


рапа ММО. ММ1 


В этой команде регистр ММО является входным операндом, а регистр ММ1 — вы- 
ходным. Команда вычисляет поразрядное логическое И значений, содержащихся 
в регистрах ММО и ММ1, и сохраняет результат в регистре ММО. 

Перейдем к анализу ММХ-команд. Их условно можно разделить на группы: 


э® команды сложения и вычитания, 
э команды сдвига; 

® логические команды; 

® команды умножения; 

® команды сравнения; 

» команды упаковки и распаковки; 
® команды передачи данных. 


Познакомимся с каждой группой команд более подробно и начнем с команд 
передачи данных. 


12.1. Команды передачи данных 


В группу команд передачи данных входят команды по\4 и поуд. Команда по\4 по- 
зволяет копировать 32-разрядное число: 
» из младших разрядов одного ММХ-регистра в младшие разряды другого 
(старшие разряды заполняются нулями); 


® из переменной в памяти либо из целочисленного регистра в младшие 32 
разряда ММХ-регистра (старшие разряды заполняются нулями); 


» Из младших разрядов ММХ-регистра в ячейку памяти либо в целочислен- 
ный регистр. 





12.2. Команды сложения 275 


Команда по\д выполняет копирование 64 бит: 
» из одного ММХ-регистра в другой; 

» из памяти в ММХ-регистр; 

» из ММХ-регистра в память. 


Среди всех ММХ-команд только по\4 и пюуд могут иметь выходной операнд в па- 
мяти, а по\у — единственная команда, операнд которой может находиться в 32-раз- 
рядном регистре процессора. 


12.2. Команды сложения 


ММХ-команды сложения и вычитания работают с упакованными байтами и сло- 
вами со знаком и без знака, а также с упакованными двойными словами со зна- 
ком. Они могут использовать как циклическую арифметику, так и арифметику 
с насыщением. К командам этой группы относятся: 


® рада, радди, рада — формируют результат по принципу циклической ариф- 
метики. Команды ра49 выполняют сложение элементов данных (байтов, 
слов или двойных слов) входного и выходного операндов. Если сумма вы- 
ходит за границу допустимого диапазона, то, по правилам циклической 
арифметики, избыток отсчитывается от другой границы диапазона. «Пере- 
носа» единицы из одного элемента данных в другой не происходит. Вход- 
ной операнд может находиться в ММХ-регистре или в памяти; выходной 
операнд должен находиться в ММХ-регистре; 


® рада, рад45м — формируют результат по принципу арифметики со знако- 
вым насыщением. Команды выполняют сложение элементов данных (бай- 
тов или слов) входного и выходного операндов. Если сумма выходит за 
граничное значение допустимого диапазона, то результатом считается это 
граничное значение. Входной операнд может находиться в ММХ-регист- 
ре или в памяти; выходной операнд должен находиться в ММХ-регистре; 


» радаизЬ, раддизм — формируют результат по принципу арифметики с без- 
знаковым насыщением. Команды выполняют сложение элементов данных 
(байтов или слов) входного и выходного операндов. Если сумма выходит 
за пределы граничного значения из допустимого диапазона, то результа- 
том считается это граничное значение. Входной операнд может находить- 
ся в ММХ-регистре или в памяти; выходной операнд должен находиться 
в ММХ-регистре. 


Работу команды раЧ9дизи при сложении слов по принципу беззнакового насы- 
щения иллюстрирует рис. 12.6. 

Из рисунка видно, что выходным операндом (операндом-приемником) коман- 
ды раддизм является регистр ММО, причем второе слово (считая с нуля по возраста- 
нию) содержит значение 65 535. Такой результат является следствием того, что 
сумма вторых слов превышает предельно допустимое значение для данного типа 
операндов (16-разрядное слово без знака), поэтому в качестве суммы берется гра- 
ничное значение. 


276 — Глава 12 » ММХ-расширение процессоров 1\е! РепНит 


раддизм ММО, ММ1 





Рис. 12.6. Сложение беззнаковых слов с насыщением 


Продемонстрирую работу команд сложения на примерах, но вначале уточню 
некоторые аспекты разработки программ, в которых используются ММХ-команды. 
Для разработки таких программ подходят только последние версии компилято- 
ров МАЗМ, например компилятор версии 7.10.хлхх, входящий в состав УЛпдо\з 
ХР ООК или \/шдо\з Зегуег 2003 ООК. Кроме того, в исходных текстах про- 
грамм обязательно должна присутствовать директива .ММХ, чтобы компилятор. мог 
транслировать ММХ-команды в машинные коды. 

Все примеры этой главы реализованы в .виде.отдельных 32-разрядных проце- 
дур. Большинство процедур содержит область данных с переменными, заданными 
определенными значениями. Это позволяет легко проверить результаты вычис- 
лений и отобразить их на экране, для чего используются простейшие консольные 
программы, написанные на языке \У15иа! С++ МЕТ, хотя можно применить и дру- 
гой 32-разрядный компилятор без переделки исходных текстов. 

Перед тем как создавать программы, использующие ММХ-расширения, сле- 
дует убедиться в том, что данный тип процессора поддерживает эту технологию. 
Для этого можно выполнить ассемблерную команду сри19, предварительно по- 
местив в регистр ЕАХ значение 1. После выполнения команды проверка 23-го бита 
в регистре ЕОХ показывает, поддерживается ли технология ММХ процессором. 
Если этот бит установлен в единицу, то поддерживается. 

В листинге 12.1 приводится исходный текст процедуры на ассемблере, позво- 
ляющей определить, поддерживается ли МММ-расширение данным процессором. 


Листинг 12.3. Проверка поддержки процессором ММХ-расширения 
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оре1оп сазетар: попе 
„дата 
$ирММХ ОВ 1 
.соде 
_$е$% тих ргос 
ту  ЕАХ. 1 
срита 
Тез+ Е0Х. 8000001 
д: ехи 
оу  $ИРММХ, 0 
ех1*: 


хог  ЕАХ. ЕАХ 
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моу АБ. $ирММХ 
ге 

_Зе$ птх епар 

ета 


Процедура _+{е$*_пттх возвращает 1 в регистре А, если технология ММХ под- 
держивается процессором, и 0 — в противном случае. 

Наш первый пример демонстрирует выполнение команды рад4Ь и реализован 
в виде процедуры _ра94Ь_ех (листинг 12.2). 


Листинг 12.2. Сложение байтов с использованием команды радаь 


.686 

моде] ГТа* 

„ММХ 
ороп сазетар:попе 
‚Дафа 

$гс 08 "РНТЬАОЕЕРНТА ЕЕУЕК5" 
1еп ЕО $-5гс 

{тр ОВ Теп БЫР (200) 
45% ОВ Теп БУР(' ').0 
.собе 

_раабЬ_ех ргос 

поу  ЕАХ, еп 


оу  ЕВХ. 8 
хог  Е0Х. ЕОХ 
Чу  ЕВХ 

оу  ЕСХ. ЕАХ 
Теа  ЕЗГ. $гс 
]Леа  ЕОГ. 454 
1еа  ЕВХ, тр 

пех: 


мод ММО. диога рёг [Е$Г] 
раадь ММО. дмога рег [ЕВХ] 
моУЧ Чмог@ рег ГЕОГ]. ММО 


а@4 ЕТ. 8 
а@4  ЕОГ. 8 
а@4  ЕВХ. 8 
дес  ЕСХ 
72  пеж 
стр ЕОХ. 0 
Ау ех1* 
му  ЕСХ. ЕОХ 
пехе1: 
оу АБ. Буе рег [ЕЗГ] 
а А. 208 
оу  Буе рёг [ЕОГ]. А 
11с  ЕЗ! 
пс ЕО 
дес  ЕСХ 
77 пех 
ех1{: 
1еа  ЕАХ. 95% 
ге 


_радаь_ех епар 
епа 





278 Глава 12 » ММХ-расширение процессоров те! Репбит 


Процедура _ра9Ь_ех заменяет пронисные символы (байты) строки $гс строч- 
ными. Для этого к каждому символу строки $гс прибавляется значение 20}, по- 
сле чего модифицированный символ сохраняется в области памяти 45+. Проце- 
дура возвращает в вызывающую программу адрес модифицированной строки 
954 в регистре ЕАХ. Напомню, что команда рад4Ь выполняет одновременное сложе- 
ние 8 байт источника и 8 байт приемника, поэтому для использования этой ко- 
манды нужно выделить из строки $гс группы символов по 8 байт. Если остается 
меньше 8 символов, то операции с ними можно выполнить с помощью обычных 
команд. Например, в нашем случае строка $ге содержит 19 символов, или 8х 2 +3. 
Следовательно, 16 символов можно обработать двукратным вызовом команды 
рада, а оставшиеся 3 — с помощью обычных команд. Если бы обрабатываемая 
строка содержала, например, 35 символов, то ее обработку можно было бы вы- 
полнить за счет 4 вызовов команды рада и, кроме этого, дополнительно обрабо- 
тать еще 3 символа. 

Посмотрим на равенство 8 х 2 +3 = 19. Число 2 в этой формуле определяет 
возможное количество итераций цикла (счетчик итераций) для команды рад, то 
есть для заданной строки $гс выполнится 2 итерации. Следующая группа команд 
позволяет определить значение счетчика итераций и поместить его в регистр ЕСХ: 


му  ЕАХ, 1еп 


оу  ЕВХ. 8 
хог Е0Х. ЕБХ 
91,  ЕВХ 

моу  ЕСХ. ЕАХ 


После выполнения этой группы команд регистр ЕСХ будет содержать счетчик 
итераций (в данном случае он равен 1), а регистр ЕОХ — количество символов, ко- 
торые необходимо обработать вне основного цикла с помощью обычных команд. 
Напомню, что при делении содержимого двух 32-разрядных регистров (ЕБХ:ЕАХ 
в данном случае) на содержимое 32-разрядного регистра ЕВХ частное сохраняется 
в регистре ЕАХ, а остаток — в регистре Е0Х. 

Следующая группа команд загружает адреса обрабатываемых строк: 

1еа  ЕЗГ. гс 


1еа  ЕОГ, 95% 
]Леа  ЕВХ. (тр 


Здесь згс — строка, которая обрабатывается в данный момент, переменная 451 
указывает на строку, в которой будет содержаться результат, а {тр представляет 
строку, содержащую группу байтов, каждый из которых равен 20Ъ. Строки $гс 
и пр имеют одинаковый размер, а строка 45% — на 1 больше, поскольку содержит 
символ 0. Наша процедура возвращает результат в виде адреса строки $51, поэто- 
му вызывающая программа, обнаружив 0, определяет конец строки. 

Собственно сложение байтов строк $гс и тр выполняется при помощи команд. 


му ММО. Чмога рег [Е$Г] 
рааЧь ММО. дмога рег [ЕВХ] 


А сохранение результата — с помощью команды 
МОУЧ Чиога рег [Е0Т]. ММО 
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Обратите внимание на то, что в этих командах используется спецификатор 
нога, указывающий на учетверенное слово (8 байт). Команды етиз здесь не требу- 
ется, поскольку никакие команды сопроцессора не используются, и синхрониза- 
ция не нужна. 

Переход к следующей 8-байтовой группе выполняется командами. 


а44 ЕЗТ. 8 
а44 ЕТ. 8 
а44  ЕВХ. 8 


Эти команды продвигают указатели адресов всех строк на 8. Далее проверяет- 
ся значение счетчика в регистре ЕС», и, если он равен 0, происходит выход из цик- 
ла. Если значение ЕСХ положительно, выполняется переход к следующей итера- 
ции (метка пехЕ). 

Если цикл завершен (ЕСХ = 0), проверяется содержимое регистра ЕБХ. Вспом- 
ним, что ЕОХ содержит число элементов строки $гс, требующих отдельной обра- 
ботки. Если это число равно 0, то есть число элементов строки $гс кратно 8, то 
происходит выход из процедуры, иначе в счетчик ЕСХ помещается содержимое ЕБХ 
(в нашем случае — 3) и обработка строки продолжается, но уже обычными ко- ` 
мандами. Эти действия выполняются в следующем фрагменте кода: 


стр  Е0Х. 0 
Ау. ех1{ 
моу  ЕСХ. ЕОХ 
пех] : 
моу АБ. Бубе рёг [Е$1] 
аа А... 201 
моу  Буе рёг [Е0П]. АЕ 
11с  Е51 
тс ЕО 
дес ЕСХ 
м2 пехи 
ех1т: 


Наконец, предпоследняя команда помещает адрес строки результата в ре- 
гистр ЕАХ: 


Теа ЕАХ. 45% 


После этого происходит выход из процедуры. 

Мы не напрасно анализировали эту процедуру столь подробно. Подобная тех- 
ника параллельной обработки данных будет использоваться и в последующих 
примерах. Эта процедура (как и все остальные) является демонстрационной, по- 
этому для большей наглядности исходные данные содержатся в самом коде, а не 
передаются в виде параметров. Программный код очень легко модифицировать 
и использовать как в программах на ассемблере, так и в приложениях на языках 
высокого уровня. 

Хочу добавить, что технология ММХ дает выигрыш в производительности но 
сравнению с использованием обычных команд. Особенно это заметно при обработке 
больших объемов данных. Если бы наша строка содержала, к примеру, несколько 
тысяч символов, разница в производительности по сравнению с аналогичной про- 
граммой, использующей обычные команды, была бы весьма ощутимой. 
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Для тестирования процедуры _рад_ех можно написать несложную програм- 
му на У15иа! С++ „МЕТ, которая отображает результат обработки строки на экра- 
не (листинг 12.3). 


Листинг 1.2.3. Демонстрационная программа для процедуры из листинга 12.2 
НисТибе <${410.1> 

ехрегп “С” спаг* радаЬ_ех(уо1а): 

17 та1п(уо1а) 


{ 

рг1"ЕР("РАООВ гезиё:\п”); 
рип + ("%5\п", рада ех()): 
гефигп 0; 


} 


В этой программе процедура радаЬ_ех объявлена внешней, возвращающей:ре- 
зультат в виде адреса строки (спецификатор спаг*). Программа отображает иа эк- 
ране строку 


РАООВ гези!\: 
ри! 1аде1рита@1уег$ 


Рассмотрим более сложный пример, в котором показана работа команды рам. 
Процедура _ра9ди ех выполняет попарное сложение элементов целочисленных 
массивов беззнаковых слов и возвращает адрес массива, содержащий суммы эле- 
ментов, в регистре ЕАХ (листинг 12.4). 


Листинг 12.4. Сложение целых чисел при помощи команды радём 


.686 

„моде {1а+ 

„ММХ 
орЁ1оп сазетар:попе 

.дата 

а1 Ом 12094. 31890. 4107. 41499, 32054. 35901. 45033. 50501. 33801 
а2 Ом 43701. 39109. 43771. 29507, 47199, 2894. 34722. 23017. 7456 
1Теп ЕОЦ $-а2 

45% 0 ]еп 0\Р(9) 

.соде 

_радаи_ех ргос 

моу  ЕАХ. 1еп 


$ийг ВАХ. 1 
моу  ЕВХ. 4 
хог  Е0Х, ЕБХ 
Фу  ЕВХ 

му  ЕСХ. ЕАХ 
]1еа — ЕЗГ. а1 
1еа  ЕОТ. а2 
1еа  ЕВХ. 45% 

пех: 


ЮУа ММО. Чнога рег [Е$Т] 
раааи ММО. диога рег [Е01] 
моУЧ Чмога рег [ЕВХ]. М0 
а94 ЕТ. 8 
а@4  ЕОГ; 8 
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‘294. ЕВХ. В 

дес  ЕСХ 

372 пех 

стр Е0Х. 0 

32 ех1+ 

ту  ЕСХ, ЕБХ 
пехё1 


ту — АХ, мога рёг [Е$Т] 
2494 АХ. мога руг [ЕО] 
ту юга рёг [ЕВХ], АХ 


2994 Е5Г. 2 
а99 РОГ. 2 
а44  ЕВХ. 2 
дес ЕСХ 
372 пех 
ех1 + 
1еа  ЕАХ. 95% 
ге 
_радаи ех епар 
епд 


Программный код процедуры _раЧ ая ех начинается с подсчета числа 8-слов- 
ных групп в массиве а2 целых чисел и определения оставшихся элементов. Это 
делается с помощью команд 


юу  ЕАХ, 1еп 


$Нг  ЕАХ, 1 
оу  ЕВХ, 4 
хог Е0Х. ЕБХ 
91"  ЕВХ 

у  ЕСХ, ЕАХ 


Здесь команда Нг ЕАХ, 1 приводит размерность массива в байтах к размерности 
слова. После выполнения команды @1у ЕВХ в регистре ЕАХ содержится количество 
64-разрядных элементов массива, а в регистре Е0Х — количество элементов, требую- 
щих обычной обработки. При указанном количестве элементов массивов а1 и а2 (оно 
равно 9) в регистре ЕАХ содержатся два 64-разрядных элемента, а в регистре ЕБХ — 
1 слово. Далее в регистры ЕЗТ, Е] и ЕВХ загружаются адреса массивов а1, а? и 95%: 


1еа  ЕЗГ, а1 
]1еа  ЕОГ, аё 
Теа  ЕВХ, 95% 


Сложение 64-разрядных элементов массивов а] и а2 выполняется командами 


пуда ММО, Чмога рег [Е51] 
ради ММО. дмога рёг [ЕСГ 


Результаты сложения копируются в массив 451 командой 
моуа дмога рег [ЕВХ]. ММО 
После этого указатели адресов продвигаются к следующим элементам массивов: 


а44  ЕЗТ. 8 
а49 РОГ, 8 
244 ЕВХ, 8 
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Затем цикл повторяется. По окончании цикла анализируется содержимое ре- 
гистра Е0Х, и если оно равно 0, то происходит выход из процедуры. Если ЕБХ со- 
держит значение, отличное от нуля, выполняется суммирование оставшихся эле- 
ментов массивов с помощью обычных команд в цикле: 


пех]: 
тоу АХ. мог@ ри" [Е$1] 


дес  ЕСХ 
д77 пех 
По окончании операции сложения элементов массивов процедура сохраняет 
адрес массива 45+ с результатами вычислений при помощи команды 


]Леа ЕАХ. 95% 


Визуально результаты вычислений можно получить с помощью простой про- 
граммы на \У150а! С++ „МЕТ, вызывающей процедуру _радди ех (листинг 12.5). 


Листинг 12.5. Демонстрационная программа для процедуры из листинга 12.4 


фНисТиде <$1910.1> 
ехбеги "С" ипз1дпед $Пог& 1п%* рабам ех(\019): 
тие ма1и(у014) 


ип$19пед $ПогЕ 110% ради = ра@ди_ех(): 
рг1пЕт("РАООМ гези1{:\п"); 
Тог (11% 11 = 0:11 < 9: 11++) 


{ 
рг1иЕ{("%4 ", *радди++); 


гебигп 0: 
} 

Хочу обратить внимание читателей на следующие особенности вызывающей 
программы: во-первых, процедура ра44и_ех объявлена как внешняя, во-вторых, 
она возвращает указатель типа ип$1дпей $Погё 11%. Этот тип указателя использует- 
ся для адресации беззнакового целого 16-разрядного числа (диапазон изменения 
0-65 535), что соответствует типу возвращаемого процедурой рам ех значения. 

Проанализируем результаты выполнения программы: 

РАООМ гези]*: 

55795 5463 47878 5470 13717 38795 14219 7982 41257 

Для удобства анализа изобразим слагаемые и результат сложения следующим 
образом: 

а] > 12094 31890 4107 41499 32054 35901 45033 50501 33801 


+ 


а2 43701 39109 43771 29507 47199 2894 34722 23017 7456 


а] + аё -» 55795 5463 47878 5470 13717 38795 14219 7982 41257 


Обратите внимание на результаты сложения, выделенные жирным шрифтом, — 
они получены с помощью команды радди. Команда ради формирует результат по 
принципу циклического переноса, то есть при превышении верхнего значения 
(65 535) для беззнакового целого числа старшие биты результата отсекаются. Вот 
почему в результате сложения чисел 31 890 и 39 109 вместо 70 999 мы получили 
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значение 5463 — это как раз и есть разность между 70 999 и 65 536. То же самое 
касается и остальных результатов, выделенных жирным шрифтом. 

Для демонстрации сложения беззнаковых операндов с помощью команды раддизи 
рассмотрим еще один пример. Особенностью команды ра@дизм является то, что 
она формирует результат по принципу беззнакового насыщения. В листинге 12.6 
с помощью процедуры _раддизм ех выполняется сложение элементов двух цело- 
численных массивов, а1 и а2. Элементы массивов представляют собой числа без 
знака размером в слово. 


Листинг 12.6. Сложение целых чисел с помощью команды радди$\ 


.686 

юбе] Раф 

„ММХ 

орё1оп сазетар: попе 

‚дата 

а1 0и 12094. 31890. 4107. 41499. 32054. 35901. 45033 
а2 Ом 43701. 39109, 43771. 29507, 7199. 2894. 4722 


1еп Е0 $-а2 
95% ПМ Теп 04Р(0) 
.с0де 


_раддизм_ех ргос 
ОУ ЕАХ. 1еп 


$Иг ЕАХ. 1 
МОУ ЕвХ, 4 
хог ЕОХ. ЕОХ 
Оу ЕВХ 

ту ЕСХ. ЕАХ 
Теа ЕЗГ. а1 
Теа ЕОТ. аё 
Теа ЕВХ. 95% 

пех: 


туд ММО. дога рег [Е$1] 
радди$м ММО, дмога рег [Е0Т] 
поУ4  Чиог@ рег [ЕВХ]. ММ0 


ада ЕЗТ, 8 

ада ЕОГ. 8 

894 ЕВХ. 8 

дес ЕСХ 

м2 пехё 

стр ЕОХ. 0 

зе ех1 

МОУ ЕСХ. ЕОХ 
пехф1 : 


ту АХ. мога рег [Е$Г] 
а94 АХ. нога рег [Е0Т] 
оу мог@ рЕг [ЕВХ]. АХ 


ада ЕТ. 2 

а94 ЕОТ, 2 

а94 ЕВХ. 2 

дес ЕСХ 

ди пех{1 
ех1{: 

Теа ЕАХ. 95% 

ге 


_раадизм ех епар 
ета 
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Мы уже встречали подобный программный код, и я не буду на этом останав- 
ливаться. А вот результаты вычислений для этой процедуры мы проанализируем 
более подробно. Составим, как и для предыдущего примера, схему сложения: 

а1 > 12094 31890 4107 41499 32054 35901 45033 


+ 


а2 43701 39109 43771 29507 7199 2894 4722 


а1 + а2 -» 55795 65535 47878 65535 39253 38795 49755 


Здесь жирным шрифтом выделены интересующие нас результаты. Из них ви 
но, что если сумма беззнаковых чисел превышает верхнее значение для 16-раз- 
рядных беззнаковых чисел (65 535), то именно это значение и становится резуль- 
татом. 

Последний пример — сложение упакованных чисел со знаком, имеющих раз- 
мер слова, при помощи команды рада5м. Результат сложения формируется по 
принципу знакового насыщения. Фрагменты программного кода, иллюстрирую- 
щие работу команды, показаны в листинге 12.7. 


Листинг 12.7. Сложение упакованных чисел со знаком при помощи команды рад4$\ 


„Дафа 

а1 Ом 21609. -13104. -30011. -9081. 31209. 12056. 21305 
а2 Ом 27791. -5959. -3290. 1544, -4407. -32099. -7901 
1еп ЕСУ $-аё 

гез 0и 7 дур (0) 

.соде 


1еа  ЕЗТ. а1 
1еа  ЕОТ, а2 
]Леа  ЕВХ. гез 


туд ММО. дога рег [Е$Т] 
туд ММ1. диога рег [ЕОТ] 
радази ММО. ММ1 

оу Чмога рег [ЕВХ]. ММО 


Результат сложения элементов массивов 16-разрядных чисел со знаком вы- 
глядит так: 
а1 -› 21609 -13104 -30011 -9081 31209 12056 21305 


+ 


аг 27791 -5959 -3290 1544 -4407 -32099 -7901 


а] + а2 -» 32767 -19063 -32768 -7537 26802 -20043 13404 


Интересующие нас результаты выделены жирным шрифтом. Сумма первых 
элементов массивов а! и а2 превышает максимально допустимое значение для 
16-разрядных чисел со знаком (32 767), поэтому оно и берется в качестве резуль- 
тата. Сумма третьих элементов массивов меньше нижней границы диапазона 
допустимых значений, поэтому в качестве результата берется значение -—32 768. 

На этом рассмотрение ММХ-команд сложения можно закончить и перейти 
к анализу команд вычитания. 
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12.3. Команды вычитания 


В группу команд вычитания входят следующие ММХ-команды: 


® рзиБ, рзибм, рзиба — вычитание элементов данных (байтов, слов или двой- 
ных слов) входного операнда из элементов данных выходного операнда. 
Если результат выходит за границу допустимого диапазона, то, по прави- 
лам циклической арифметики, соответствующее число единиц отсчитыва- 
ется от другой границы диапазона. «Переноса» единицы из одного эле- 
мента данных в другой не происходит. Входной операнд может находиться 
в ММХ-регистре или в памяти, а выходной операнд — в ММХ-регистре; 


® р5и6$Б, рзиб5и — вычитание элементов данных (байтов или слов) входного 
операнда из элементов данных выходного операнда. Результат формирует- 
ся по принципу знакового насыщения: если разность выходит за граничное 
значение допустимого диапазона, то результатом считается это граничное 
значение. Входной операнд может находиться в ММХ-регистре или в па- 
мяти, а выходной — в ММХ-регистре; 


® рзибизЬ, рзибизм — вычитание элементов данных входного операнда из эле- 
ментов данных выходного операнда. Результат формируется по принципу 
беззнакового насыщения: если разность выходит за граничное значение до- 
пустимого диапазона, то результатом считается это граничное значение. 
Входной операнд может находиться в ММХ-регистре или в памяти; выход- 
ной операнд должен находиться в ММХ-регистре. 


Команды вычитания работают с теми же типами данных и формируют резуль- 
тат точно так же, как и только что рассмотренные команды сложения. Я ие буду 
останавливаться подробно на анализе этих команд, думаю, читатель легко спра- 
вится с этим сам. Приведу лишь пример демонстрационной процедуры (она на- 
зывается _р$и65м_ех), выполняющей вычитание 16-разрядных чисел со знаком 
и использующей команду рзибзм (листинг 12.8). 


Листинг 12.8. Вычитание чисел со знаком при помощи команды рзиб$\м 


.686 
.тоде] Раф 
„ММХ 
ор&1оп сазетар:пойе 
„Дака 
81 ОМ 1609. -13104. -30011. -9081. -21209. 12056. 21305 
а2 ОМ 27791, -25959. 7290. 25544. -9407, -3099. -7901 
Теп ЕДУ $-а2 
гез Ом 1еп дир (0) 
.с0де 
_рзиубзн_ех ргос 
оу ЕАХ. Теп 


$ИГ ЕАХ. 1 
оу ЕВХ. 4 
хог ЕОХ. ЕБХ 
Ч1у ЕВХ 

ту ЕСХ. ЕАХ 


продолжение :7 
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Листинг 12.8 (продолжение) 


]еа ЕТ. а1 

Теа ЕОТ. а2 

Теа ЕВХ, гез 
пех: 


туда ММО. дога рег (Е$1] 
туда  ММ1. дога рег (Е01] 
рзиб$м ММО. ММ1 

поУ<  Чмога рёг [ЕВХ]. ММО 


етт$ 

ада ЕЗТ. 8 

ада ЕОТ. 8 

а94 ЕВХ. 8 

дес ЕСХ 

7 пех 

стр ЕОХ. 0 

де ех1{ 

тоу ЕСХ. ЕОХ 
пех]: 


ту — АХ. мога рег ([Е5$0] 
$6 АХ. мога раг [Е01] 
тоу  мог@ рёг [ЕВХ]. АХ 


а64 ЕТ. 2 
ад4 ЕО, 2 
ада ЕВХ. 2 
дес ЕСХ 
72 пехё1 
ех1{: 
1еа ЕАХ. мог рег гез 
ге 
_рзибзм_ех епар 
епд 


Процедура возвращает адрес результата (массив гез, содержащий суммы. чи- 
сел) в регистре ЕАХ. Вызывающая эту процедуру программа на \151а| С++ МЕТ 
выглядит так, как показано в листинге 12.9. 


Листинг 12.9. Демонстрационная программа для процедуры из листинга 12.8 


фтисТиде <$&410.Н> 
ехбегп "С" $Поге 1п%* рзиб$м _ех(\014); 
Ти ма1и(у019) 


{ 


Зпоге Чие* рзибзм = рзибзм_ех(); 
реп ("РЗУВЬМ гези1*:\п"); 
Фог (170 11 = 0:11 <7: 11++) 


реТиЕР( "$4 ", *рзиб$и++): 
гефиги 0: 
Поскольку процедура _рзибзи_ех возвращает адрес массива 16-разрядных чи- 


сел со знаком, в вызывающей программе должен быть определен указатель типа 
$погЕ 1п*. Вызываемая процедура, как обычно, объявлена с директивой ехфегп. 
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Результат работы процедуры можно схематически представить таким образом: 
а1 > 1609 -13104 -30011 -9081 -21209 12056 21305 


а2 27791 -25959 7290 25544 -9407 -3099 -7901 


а1 + а2 -» -26182 12855 -32768 -32768 -11802 15155 29206 


Поскольку команда вычитания знаковых слов р$иб5м формирует результат по 
принципу знакового насыщения, то две разности (выделенные жирным шриф- 
том) вышли за пределы нижней границы для 16-разрядных чисел со знаком и им 
было присвоено значение —32768. 

Следующая, очень важная группа команд, которую мы рассмотрим, — это ко- 
манды упаковки и распаковки данных. 


12.4. Команды упаковки и распаковки данных 


ММХ-команды упаковки преобразуют длинные элементы данных (16- и 32-раз- 
рядные слова) в более короткие. Если исходное значение «не помещается» в ко- 
ротком элементе данных, то происходит «насыщение» — результатом считается 
граничное значение допустимого диапазона выходного типа данных. Команды 
распаковки попарно объединяют элементы данных из обоих операндов в более 
длинные элементы выходного операнда. Этими командами можно пользоваться 
для увеличения числа значащих разрядов при вычислениях. 
К этой группе команд относятся: 


® раскзм, раск$$4и — преобразование длинных элементов данных (16- и 32-раз- 
рядных слов со знаком) в более короткие (байты или 16-разрядные слова 
со знаком). Если исходное значение было за пределами допустимого диа- 
пазона для выходного типа данных, то результатом упаковки считается 
ближайшее граничное значение диапазона. Входным операндом может вы- 
ступать ММХ-регистр или ячейка памяти, выходной операнд должен нахо- 
диться в ММХ-регистре; 


® раскизмь — выполняет преобразование 16-разрядных слов со знаком из обо- 
их операндов в байты без знака и записывает их в выходной операнд. Если 
исходное слово со знаком было больше ЕЕЬ, результатом преобразования 
считается РЕБ. Если исходное слово со знаком отрицательно, результа- 
том преобразования считается 00}. Входным операндом может выступать 
ММХ-регистр или ячейка памяти, выходной операнд должен находиться 
в ММХ-регистре. 


Работа команд упаковки станет более понятной, если посмотреть на рисунки, 
иллюстрирующие их работу. Например, следующая команда функционирует так, 
как показано на рис. 12.7: 

раск$$м ММО. ММ1 

Здесь операндом-источником является регистр ММ, а операндом-приемником — 


регистр ММО. Четыре слова регистра ММ1 упаковываются в старшие четыре байта 
регистра-приемника ММО, а четыре слова регистра ММО — в младшие четыре байта ММО. 
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ММ1 ММО _ 





ММО . 
Рис. 12.7. Функционирование команды раск$м 
Рисунок 12.8 иллюстрирует принцип работы команды 
раск$$ди ММ1. ММ2 
ММ2 мм! 





63 15 0 
мм! 


Рис. 12.8. Функционирование команды раске$ м 


В этом случае операндом-источником является регистр М2, а операндом-прием- 
ником — регистр ММ1. Два двойных слова регистра ММ2 упаковываются в два старших 
слова регистра-приемника ММ1, а два двойных слова регистра ММ1 — в младшие два 
слова регистра ММ]. 

Рассмотрим практические примеры применения команд упаковки в програм- 
мах на ассемблере. Первый пример реализован как процедура _раск$$и6_ех и де- 
монстрирует работу команды раск$$м (листинг 12.10). 


Листинг 12.10. Упаковка знаковых слов в байты при помощи команды раскК$5\ 


.686 
.тЮде] Паф 
„МЫХ 
оре1оп сазетар: попе 
„дата 
а1 ОМ 45. -41. 67. -134. -61. 10. -88, 12, -62. .161.-99 
Теп ЕДИ $-а1 
гез ОВ 1еп 0Р(0) 
‚сое 
_раск$з\_ех ргос 
тоу ЕАХ, 1еп 
$вг ЕАХ. 1 
хог ЕОХ. ЕБХ 
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ту ЕВХ. 2 
1, ЕВХ 
ту ЕСХ. ЕАХ 
1Леа ЕЗГ, а1 
1еа ЕОТ, гез 
пех: 
туд ММО. диога ри“ [Е$Г] 
раск$$иб ММО, дмог@ рег [Е$1+8] 
Уд Чмог@ р%г [ЕСГ]. ММ0 


ада ЕЗТ. 16 
ада ЕОТ, 8 
дес ЕСХ 

72 пехе 
стр ЕОХ. 0 
3е ех1{ 


оу АЕ. Бухте руг [Е$Г] 
ЮУ Буе рёг [Е0Т], А 


ех1{: 
Теа ЕАХ. гез 
ге 
_раск$$\Ь_ех епар 
ета 


Здесь элементы размером в слово из массива а1 упаковываются в байты мас- 
сива гез. Процедура _раск5$"_ех возвращает адрес массива гез в регистре ЕАХ. 
Второй пример демонстрирует работу команды раск$$4и (листинг 12.11). Проце- 
дура _рахк$$4м_ех выполняет упаковку двойных слов из массива а1 в элементы од- 
нословного массива гез. 


Листинг 12.11. Упаковка знаковых двойных слов в слова 


.686 
„людей! Наф 
„ММХ 
ор Топ сазетар:попе 
‚дата 
а1 00 7345.-4123.671.-34802.-611.75056.-8893.12.-6227.41161.-9991 
1Теп ЕСИ $-а1 
гез 0 1еп 0Р(0) 
.соде 
_раск$$дм_ех ргос 
пюу ЕАХ, Теп 
иг ЕАХ. 2 
хог ЕОХ. ЕОХ 
ту ЕВХ. 2 
@1у ЕВХ 
тои ЕСХ. ЕАХ 
1Леа ЕЗГ, а1 
1еа ЕОГ. гез 
пехё: 
ПОУЧ ММО. дмога рег [Е$Г] 
раск$$м ММО. мог рег [Е$1+8]. 
ПОУЧ Омог@ рёг [ЕОГ]. ММО 


ада ЕЗТ. 16 продолжение 
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Листинг 12.11 (продолжение) 


а94 ЕОГ. 8 
дес ЕСХ 
Зиг пех 
стр ЕОХ. 0 
3е ех1{ 


ЮУ АХ. мога рёг [Е5Г] 
ту мог@ рег [ЕОТ]. АХ 


ех1{: 
1еа ЕАХ. гез 
ге 
_раск$$4и_ех епар 
епд 


Следующие команды этой процедуры приводят размер массива, выраженный 
в байтах, к количеству двойных слов: 


оу ЕАХ. Теп 
зн" ЕАХ. 2 


Для одновременной обработки 8-байтовых чисел необходимо выделить груп- 
пы элементов по 2 двойных слова, что и выполняет следующий фрагмент кода: 

хог ЕОХ. ЕОХ 

тои ЕВХ. 2 


99, ЕВХ 
тои ЕСХ. ЕАХ 


После выполнения этих команд в регистре ЕСХ окажется количество учетве- 
ренных слов, а регистр ЕОХ будет содержать оставшиеся элементы массива, тре- 
бующие отдельной обработки. 

Основной цикл обработки: 

пех: 


Уд ММО. Чмогд р&г [Е$Г] 
раск$$6и ММб. дмога рёг [Е$1+8] 


}е ех{ 
Этот цикл содержит команду, выполняющую упаковку четырех двойных слов 
{двух в регистре ММ и двух из ячейки памяти с адресом [Е$1+8]): 


раск$$@и ММО, дмога рёг [Е$1+8] 


Оставшийся одиночный элемент размером в двойное слово обрабатывается 
обычными командами: 


ту АХ. мога рег [Е$Т] 
ЮУ мога рёг [ЕОГ]. АХ 


Последняя команда перед выходом из процедуры сохраняет адрес массива гез 
в регистре ЕАХ. 

Третий пример более сложен по сравнению с предыдущими и демонстриру- 
ет сложение операндов размером в слово, предварительно упакованных в байты. 
В листинге 12.12 представлен исходный текст процедуры (она называется _а94_ 
раск_Буе$), которая выполняет эти операции. 
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Листинг 12.12. Сложение слов, упакованных в байты 


.686 
„лоде] Нах 
„ММХ 
орЁ1оп сазетар:попе 
„.Чафа 
а1 0М 45, -41. 67, -134. -61, 10, -88, 12. -62, 61.-99 
Ь1 ОМ 37. -19. 122, 54. 88. 19. 133. 49. 13. 11.-29 
Теп ЕСИ $-51 
а1_ сору ОВ 1еп 0Р(0) 
Ь1_сору ОВ 1еп 0ИР(0) 
гез ОВ 1еп 0\Р(0) 
.соде 
_а@4_раск_Бу®ез ргос 
тоу ЕАХ, 1еп 
$Иг ЕАХ. 1 
хог ЕОХ. ЕБХ 
ту ЕВХ. 2 
Чу ЕВХ 
тоу ЕСХ. ЕАХ 
ризй ЕСХ 
ризй ЕОХ 
Теа ЕЗТ. а1 
1Теа ЕОТ. а1_сору 
са11 сопуег_+0_Буфез 
Теа Е$Г. 51 
Теа ЕОТ. 61 _сору 
рор Е0Х 
рор ЕСХ 
са11 сопуеге_+0о_Буфез 
тмоу ЕАХ. 1еп 
тоу ЕВХ, 8 
хог ЕБХ. ЕОХ 
Чу ЕВХ 
тоу ЕСХ. ЕАХ 
1еа Е$1. а1_сору 
1еа ЕТ, Б1_сору 
]Леа ЕВХ. гез 
ада1п: 
тоуд ММО, дмога рег [Е$Т} 
рада$Ь ММО. дмога рег [ЕОТ] 
мод  Чмога рёг ГЕВХ]. ММО 


а@4 — ЕТ, 8 

а@94 — Е0Т. В 

аа — ЕВХ, В 

дес ЕСХ 

дп адатп 

стр ЕОХ. 0 

3 ех1Е 

моу ЕСХ. ЕБХ 
пехе_Бубе: 


оу АХ, мога рёг [ЕЗГ] 


299 — АХ. мога рёг [ЕВГ продолжение 2 
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Листинг 12.12 (продолжение) 


оу 
а99 
а99 
а99 
дес 
77 
ех{: 
]еа 
ге 
сопу 
пех: 
ОУЧ 
раск 
ПОУЧ 


сопуег 
_а9а р. 
епа 


мога рег [ЕВХ], АХ 
ЕТ, 2 

ЕОГ. 2 

ЕВХ. 2 

ЕСХ 

пехе_Бубе 


ЕАХ, ге$ 
ег _фо_Буфез ргос 


ММО. дмога рег [Е$Г] 
$$\6 ММО. дмога рёг [Е51+8] 

Чиог@ рёг [Е01], ММО 

ЕЗЕ. 16 

ЕОТ, 8 

ЕСХ 

пехё 

ЕОХ. 0 

Чи 

ЕСХ. ЕБХ 


АЕ, Буфе рёг [Е$1] 
Бубе рёг [ЕСТ], А 


Е Ро Бубе$ епар 
аск_Буфез епар 


Анализ работы процедуры начнем с описания данных. В области данных про- 
цедуры определены пять массивов: 


а1 и 51 — исходные значения однословных чисел со знаком; 


а! _сору и Б1_сору — упакованные в байты однословные элементы из масси- 
вова| и 51; 


гез — суммы упакованных байтов. 


Алгоритм работы процедуры _а94_раск_Буфез можно представить так: вначале 
размер массивов в байтах приводится к размерности в словах с помощью команд 


Се 
$Иг 


ЕАХ, 1еп 
ЕАХ. 1 


Затем из массивов а! и Б1 выделяются группы элементов по 4 слова (8 байт) 
и количество этих групп помещается счетчик ЕСХ: 


хог 
тоУ 
Ч1у 
оу 


ЕОХ. ЕОХ 
ЕВХ, 2 
ЕВХ 

ЕСХ. ЕАХ 
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Количество элементов, оставшихся вне групп, помещается в регистр ЕБХ. 

Далее выполняются преобразование элементов массивов а1 и 1 из слов в бай- 
ты и сохранение преобразованных элементов в массивах а1_сору и 61 _сору: 

1еа ЕЗТ, а1 

1еа ЕСТ, а1_сору 

са11 сопуег® фо_Буфе$ 

Теа ЕЗТ, 51 

1Теа ЕОТ, Ь1 сору 

рор ЕОХ 

рор ЕСХ 

са11 сопуегт фо _Бубе$ 

Преобразование элементов обеспечивает подпрограмма сопуегЕ_+о_Буфез. С по- 
мощью этой подпрограммы массивы слов а1 и Ь1 преобразуются в массивы байтов 
(а1_сору и 1 _сору соответственно), после чего и выполняется сложение. Результа- 
ты сложения сохраняются в массиве гез. 

Подпрограмма сопуег&_{о_Буфез для преобразования использует команду 


раск$$мЬ ММО, дмога рег [Е$1+8] 


Эта команда повторяется в цикле, счетчик которого находится в регистре ЕСХ 
и кратен восьми. После каждой итерации указатель адреса исходного массива 
(регистр Е5Т) перемещается на 16, а указатель массива-приемника (регистр ЕТ) — 
на 8. По завершении цикла пехё оставшиеся элементы массива просто копируют- 
ся из массива а] в Б]. 

После преобразования выполняется сложение упакованных байтов массивов 
а1_сору и Ь1_сору при помощи команды 


раач$Ь ММО. диога рёг ГЕО] 
Это происходит в цикле 


ада1п: 
рабазь ММО, днога ры" [Е0Т] 


дес ЕСХ 
дп ада!" 


Хочу напомнить, что при упаковке операндов необходимо учитывать диа- 
пазон формата упакованных чисел, поскольку легко потерять значимость ре- 
зультата! 

Для отображения результатов сложения на экране используется программа, 
написанная на \У!5иа! С++ МЕТ (листинг 12.13). 


Листинг 12.13. Демонстрационная программа для процедуры из листинга 12.12 


НисТиде <5Е41о.1> 
ехфегп "С" $1дпе4 спаг* ад@_раск_Буфе$ (мот); 
11% мати(уота) 


{ 


$1дпед спаг* а@_раск = а44_раск_Бубез(): продолжение 2 
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Листинг 12.13 (продолжение) 


рг1"ЕР("ЗИММА ОР РАСКЕО ВУТЕЗ: \п"); 
Тог (118 11 = 0:11 < ПАН+) 


реп ("#4 ". *а4Ч раск++): 


} 


гефигп 0: 


} 


При указанных значениях элементов массивов результат на экране будет вы- 
глядеть так: 


ЗИММА ОЕ РАСКЕО ВУТЕЗ: 
82 -60 127 -74 27 29 39 61 -95 86 -128 


Сейчас мы рассмотрим команды, выполняющие обратное действие по сравне- 
нию с командами упаковки — распаковку данных: 


рипрскИЬм, рипрскима, рипрскпаа — попарное объединение исходных элемен- 
тов данных (байтов, 16- или 32-разрядных слов), находившихся в старших 
32 разрядах обоих операндов. Полученные в результате более длинные эле- 
менты данных записываются в выходной операнд. Исходные значения 
младших разрядов операндов на результат не влияют. Входным операндом 
может выступать ММХ-регистр или ячейка памяти, выходной операнд 
должен находиться в ММХ-регистре; 


рипрсК1Ьм, рипрсК1ма, рипрск19а — попарное объединение исходных элемен- 
тов данных (байтов, 16- или 32-разрядных слов), находившихся в младших 
32 разрядах обоих операндов. Полученные в результате более длинные 
элементы данных записываются в выходной операнд. Исходные значения 
старших разрядов операндов на результат не влияют. Входным операндом 
может выступать ММХ-регистр или ячейка памяти, выходной операнд 
должен находиться в ММХ-регистре. 


Механизм работы команд распаковки станет более понятным, если посмот- 
реть на рисунки, иллюстрирующие их работу. Например, следующая команда 
функционирует так, как показано на рис. 12.9: 


рипрсекИбм ММО. ММ1 


63 


ММ1 ММО 





мо 
Рис. 12.9. Работа команды рипрскАЬм 
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Команда рипрскИБм распаковывает старшие четыре байта операндов в опе- 
ранд-приемник. Для рассматриваемой схемы операндом-источником является 
регистр ММ1, а регистром-приемником — ММ0. Как видно из рис. 12.9, старшие четы- 
ре байта регистра ММ1 становятся старшими байтами однословных элементов ре- 
гистра ММО, а старшие четыре байта регистра ММО — младшими байтами однослов- 
ных элементов. 

Еще одна схема, показанная на рис. 12.10, иллюстрирует функционирование 
команды 


рипрскима ММ2. ММЗ 


ММЗ ММ2 





ММ2 
Рис. 12.10. Работа команды рипрсКАма 


Команда рипрсКИма распаковывает старшие два слова операндов в операнд-при- 
емник. Для рассматриваемой схемы операндом-источником является регистр ММ2, 
а операндом-приемником — регистр ММ2. Из рис. 12.10 видно, что старшие два 
слова регистра ММЗ становятся старшими словами двухсловных элементов регист- 
ра ММг, а старшие два слова регистра ММ? — младшими словами двухсловных эле- 
ментов в ММ2. 

Рисунок 12.11 иллюстрирует функционирование команды 


рипрскпаа ММО. ММ1 


63 31 0 63 31 0 





63 | 31 0 
ММО 
Рис, 12.11. Работа команды рипрскИаа 


Команда рипрски@4 распаковывает старшие двойные слова операндов в опе- 
ранд-приемник. Для рассматриваемой схемы операндом-источником является 
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регистр ММ1, а операндом-приемником — регистр ММ. Из рис. 12.11 видно, что 
старшее двойное слово регистра ММ1 становятся старшим двойным словом учетве- 
ренного слова в регистре ММО, а старшее двойное слово регистра ММ0 — младшим 
двойным словом учетверенного слова в ММО. 

Если команды рипрскИБм и рипрсКАм оперируют старшими частями 64-раз- 
рядных операндов, то команды рипрск1Ьм, рипрсК1ма и рипрск194 обрабатывают 
младшие части 64-разрядных операндов. Последующие схемы демонстриру- 
ют работу этих команд. На рис. 12.12 показана схема функционирования ко- 
манды 


рипрск1Ьм ММО. ММ1 
ММ1 ммо 


63 7о 
ПО О ПО О ПО О О О 





то 


мо 
Рис. 12.12. Работа команды рипрсКЬ\м 


На рис. 12.13 показана схема работы команды 
рипрск1ма ММ1. Мм2 


ММ2 ММ1 





63 


ММ1 
Рис. 12.13. Работа команды рипрскКма 


На рис. 12.14 показана схема работы команды 
рипрск199 ММЗ. ММ4 
Рассмотрим практические примеры применения команд распаковки в про- 


граммах на ассемблере. Первый пример демонстрирует работу команд рипрскИбм 
и рипрск1Ьм. Процедура называется _рипрсКЬи_ех (листинг 12.14). 
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ММЗ 
Рис. 12.14. Работа команды рипре Нд 


Листинг 12.14. Распаковка байтов в слова при помощи команд рипрсКИБ\ и рипрсКЬм 


. 686 
„тоде] Рак 
„ММХ 
орё1оп сазетар: попе 
дата 
$1 08 '+++ ++++' 
$2 ОВ '32107654' 
гез ОВ 16 БР (’').0 


.соде 

_рипрсКЬм_ех ргос 
]Теа ЕЗТ, $1 
]еа ЕТ, $2 
]еа ЕВХ. гез 


ПОУЧ ММО. чиога рёг [ЕОТ] 
рипрсКИБи ММО, дмога рёг [Е$Г] 
МОУа Чиог@ рёг [ЕВХ]. ММО 
ада ЕВХ. 8 

ПОУЧ ММО. дмога рЁг [ЕОГ] 
рипрск1Ьм ММО, дмога рёг ГЕЗТ) 
МОУЧ 9мога рёг [ЕВХ]. ММО 


Теа ЕАХ. гез 
ге 
_рипрскЬм ех епар 
епд 


Алгоритм работы процедуры можно описать так: разместить символы строки 
$2 в порядке убывания и поместить между ними символы + строки $1. Эта последо- 
вательность символов должна размещаться в новой строке гез. В этом случае ре- 
зультирующая строка гез должна выглядеть как «7 +6+5+4+3+2+1+0». 
Процедура возвращает в основную программу адрес этой строки в регистре ЕАХ. 
Несмотря на относительно простой программный код, результат, вообще говоря, не 
очевиден, поэтому мы проведем детальный анализ работы процедуры _рипрсКЬм_ех. 

Для адресации всех трех строк используются регистры ЕЗТ, ЕБ1 и ЕВХ, что и от- 
ражено в первых строках программного кода: 

1еа ЕЗТ, $1 


1еа ЕТ. $2 
Теа ЕВХ, гез 
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Далее, в регистр ММО с помощью следующей команды загружается строка $2: 
оу ММО, дмога рёг [ЕОГ] 


Теперь проанализируем содержимое регистра ММО, который является операн- 
дом-приемником, и содержимое строки $1, являющейся операндом-источником 
(рис. 12.15). 


тоуд ММО, адмога ри [ЕО] 


63 0 





Рис. 12.15. Состояние операндов перед выполнением команды рипрскиБ\ 


На рисунке серым цветом выделены старшие 4 байта операндов. После выпол- 
нения следующей команды результат помещается в регистр ММО, а его содержимое 
формируется так, как показано на рис. 12.16; 


рипрскИБм ММО, дога рёг [Е$Т] 
рипрскАБм ММО, дмогд ри [Е$ 1] 


63 0 63 0 





мо 
Рис. 12.16. Состояние операндов после выполнения команды рипрскиБ\м 


Затем результат, находящийся в регистре ММО, сохраняется в младших восьми 
байтах переменной гез при помощи команды 

поуд дмога рёг ГЕВХ]. ММ0 

Обратите внимание, что младший байт строки гез представлен символом 7. 
Далее смещаем указатель результирующей строки ге$ на 8 (команда а04 ЕВХ, 8) 
и обрабатываем младшие 4 байта операндов с помощью команд 

МОУЧ ММО. амога рёг [ЕОТ] 


рипрск1Ьм ММО, диога рёг [Е$1] 
МОУЧ Чиога р&г [ЕВХ]. ММО 
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Среди этих команд особый интерес вызывает команда 
рипрсКЛЬм ММО. дмога рег [ЕЗГ] 


Результат ее выполнения схематически можно представить рис. 12.17 (серым 
цветом выделены обрабатываемые байты). 


рипрсКЬм ММО, дмога ри [Е$!] 





мо 
Рис. 12.17. Состояние операндов после выполнения команды рипрсКЬм 


На этом обсуждение программного кода процедуры _рипрскЬм_ех можно закон- 
чить. Для проверки результата ее выполнения можно воспользоваться програм- 
мой на \15иа| С++ МЕТ (листинг 12.15). 


Листинг 12.15. Демонстрационная программа для процедуры из листинга 12.14 
ЗИпсТиде <5%910.1> 

ехфегп "С" спаг* рипрскЬм_ех(\о14); 

11% малп(у019) 


спаг* рипрсКЬм = рипрсКЬм ех(): 
ри1иЕР( "РИМРСКНВИ/РИМРСКЕВИ ехатр1е:\п"); 
рег" т ("%$\ п”. рипрскКЬм): 
гебигп 0: 
} 


Программа выводит на экран следующие строки: 


РИМРСКНВИ/РИУМРСКАВИ ехатр1е: 
7+6+5+4+3+2+1+0 


Работу еще двух команд — рипрсКИма и рипрск1м — демонстрирует следую- 
щий пример (листинг 12.16). Ассемблерная процедура _рипрсКки4_ех формирует 
в массиве гез последовательность чисел, расположенных в двух массивах — а1 иа2? — 
в диапазоне 100-107. 


Листинг 12.16. Распаковка слов в двойные слова при помощи команд рипрсКАМА и рипрок\ма 
. 686 

„лю4е1 11а* 

„ММХ 

орЁ1оп сазетар: попе 


‚Чата 
продолжение :7 
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Листинг 12.16 (продолжение) 
а1 1абе] 9дмога 
Ом 104. 106.100, 102 
а2 Табе? дога 
ОИ 105, 107, 101. 103 
гез 00 4 ЦР (0) 


.соде 

_рипрекма_ех ргос 
Теа ЕЗТ. а1 
]еа ЕОТ, а2 
Теа ЕВХ. гез 


ПОУЧ ММО, нога рёг [Е$Г] 
рипрскНма ММО. дмога рёг [ЕОТ] 
ПОУЧ Чиога рёг [ЕВХ). ММО 
а99 ЕВХ, 8 

тОУЧ ММО. диога рёг [Е$Г] 
рипрск1мЧ ММО, дмога рёг Г[ЕОГ] 
моуа Чмога рёг ГЕВХ]. ММО 


Теа ЕАХ. гез 
ге 
_рипрсКи_ех епар 
епа 


В процедуре определены три массива целых чисел, содержащие двухбайтовые 
(однословные) элементы: а1, а2 и гез. Элементы массивов а] и а? распаковывают- 
ся в массив гез, состоящий из четырех двойных слов. Как и в предыдущем приме- 
ре, первые три команды 1еа загружают в регистры ЕЗТ, ЕОГ и ЕВХ адреса, но только 
не строк, а массивов. Далее в регистр ММ0 помещаются элементы массива а1, после 
чего выполняется распаковка старших слов операнда-источника (массив а2, ука- 
затель в ЕОГ) и операнда-приемника (регистр ММ0) с помощью команды 


рипрскИмЧ ММО, дмога рёг [ЕОГ) 


Эту операцию иллюстрирует схема, показанная на рис. 12.18 (задействован- 
ные в операции элементы показаны серым цветом). 


рипрскАма ММО, дмога р [ЕО] 


63 0 63_ 0 





мо 
Рис. 12.18. Состояние операндов после выполнения команды рипрсКАм4 


Как видно из рисунка, старшие слова операнда а2 помещаются в старшие сло- 
ва двух двойных слов в регистре ММ, а старшие слова операнда-источника в ММО — 
в младшие слова двойных слов в регистре ММ. 
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Далее указатель адреса для массива гез продвигается на 8 (команда а04 ЕВХ, 8), 
после чего выполняется распаковка младших слов массивов а1 и а2 в массив гез. 
Ключевую роль в этом процессе играет команда 


рипрсК1ма ММО, смога рег [ЕТ] 
Схема ее работы продемонстрирована на рис. 12.19. 
рипрсКма ММО, дмога рёг (ЕВ! 





ммо 
Рис. 12.19. Состояние операндов после выполнения команды рипрсКма 


Младшие слова операнда а2 помещаются в старшие слова двух двойных слов 
в регистре ММ0, а младшие слова операнда-источника в ММО — в младшие слова 
двойных слов в регистре ММО. Обрабатываемые операнды выделены на рисунке 
серым цветом. 

Для визуального отображения результатов работы процедуры служит про- 
грамма на \У15иа| С++ МЕТ (листинг 12.17). 


Листинг 12.17. Демонстрационная программа для процедуры из листинга 12.16 
ЯНисТиде <$6910.1> 

ех{егт "С" зпогё 1пё* рипрсКма_ех(\014); 

116 па1п(\01а) 


{ 

зпогЕ 1пЕ* рипрсКма = рипрскма_ех(): 
рг1иЕ( "РИМРСКНИО/РУМРСКЕМО ехатр1е:\п”); 
Тог (118 11 = 0:11 < 8;11++) 


риТПЕР( "#4 “, *рипрски@++); 
} 


гебиги 0: 

} 

Программа вызывает процедуру рипрскиа_ех, объявленную внешней (директи- 
ва ежегп), и выводит следующий результат: 

РИМРСКНИО/РИМРСКЕМО ехатр1е: 

100 101 102 103 104 105 106 107 

Перейдем к рассмотрению следующей группы ММХ-команд — группы, в ко- 
торую входят команды умножения. 
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12.5. Команды умножения 


ММхХ-команды умножения попарно перемножают 16-разрядные слова операн- 
дов, что дает четыре 32-разрядных произведения. Все команды формируют ре- 
зультат по принципу циклической арифметики: 


®» ртаддиа — попарное умножение 16-разрядных слов со знаком, находящихся 
в двух операндах. После получения в результате четырех 32-разрядных 
произведений первое произведение складывается со вторым, а третье -— с чет- 
вертым. Суммы записываются в 32-разрядные слова выходного операнда. 
Если все слова на входе равны 80005, результат равен 800000001 (единст- 
венный случай, когда перемножение отрицательных чисел дает отрица- 
тельный результат). Входным операндом может выступать ММХ-регистр 
или ячейка памяти, а выходным операндом должен быть ММХ-регистр. 
Алгоритм работы команды ртадди@ показан на рис. 12.20; 


ртафам ММО, ММ1 
[м рю рю [м м 
[м | [м | 


ММ1 


х1 ху1 + х2 ху2 ХЗ х УЗ + х4 х у4 ММО 


Рис. 12.20. Умножение 16-разрядных слов с помощью команды ртадамаА 


® рим — попарное умножение 16-разрядных слов со знаком, находящихся во 
входном и выходном операндах. Результатом операции являются четыре 
32-разрядных произведения, при этом старшие разряды произведений сохра- 
няются в 16-разрядных словах выходного операнда, а младшие разряды про- 
изведений теряются. Входным операндом может выступать ММХ-регистр 
или ячейка памяти, а выходным операндом должен быть ММХ-регистр; 


® рпм — попарное умножение 16-разрядных слов со знаком входного и вы- 
ходного операндов, что дает четыре 32-разрядных произведения. Младшие 
разряды произведений сохраняются в 16-разрядных словах выходного опе- 
ранда, а старшие разряды произведений теряются. Входным операндом мо- 
жет выступать ММХ-регистр или ячейка памяти, а выходным операндом 
должен быть ММХ-регистр. 

Команды рти1Им и рту! Тм позволяют выполнить умножение четырех 16-разряд- 
ных операндов одновременно, при этом разрядность результатов умножения оказы- 
вается в два раза больше разрядности операндов. Для получения полного результата 
умножения с помощью этих команд необходимо выполнить такую последователь- 
ность шагов: ` 


1. Получить старшие 16 бит произведения, используя команду рти1Им. 
2. Получить младшие 16 бит произведения, используя команду рти! м. 
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3. Объединить частичные результаты в одно двойное слово с помощью ко- 
манд рипрскима и рипрскТма. 


Рассмотрим примеры использования команд умножения. Вначале проанали- 
зируем алгоритм работы процедуры _ти11р1у ех, в которой выполняются коман- 
ды рим и ртиу11м. Процедура обеспечивает умножение 16-разрядных целочис- 
ленных операндов из двух массивов, а! и а2, и сохраняет 32-разрядные результаты 
в массиве гез. Исходный текст процедуры представлен в листинге 12.18. 


Листинг 12.18. Умножение 16-разрядных чисел двух массивов при помощи 
команд ртийм/ и рим 


.686 

„люде] Е]а* 

„ММХ 

ор&1оп сазетар:попе 

„дата 
а1 ОИ 34. -56, 29. 91, -5. 27. 139. 44. -791, -30. -802 
а2 Ом -12. 3. -52. 23. -67. 322. -501. 122. -7. -15. 199 
Теп ЕСУ $-а2 
гез 00 1еп 0\Р(0) 

.соде 

омумир1у_ех ргос 
моу  ЕАХ. Теп 


зйг  ЕАХ, 1 
моу  ЕВХ. 4 
хог  ЕОХ, ЕОХ 
Чу  ЕВХ 

му  ЕСХ. ЕАХ 
Теа ЕЗГ. а1 
Леа ЕОТ. а2 
Теа ЕВХ. ге$ 

пех: 


поуа ММ, 9мога рёг [ЕЗП] 
поуа ММО. чиога рег [ЕО] 
рти1Ам ММО. ММ1 

муа  ММ2. 9мога рег [ЕОТ] 
рти11м ММ. ММ2 

тоуа  ММ2. ММО 

ма ММЗ. ММ1 

рипрскйма ММЗ. ММ2 
рипрск1ма ММ1, ММО 

поУЧ  Чмога рек [ЕВХ]. ММ1 
поуа  Чмога рег [ЕВХ+8], ММЗ 


ааа ЕЗГ. В 
ааа ЕОТ. 8 
ааа ЕВХ. 16 
дес ЕСХ 

32 пех 

стр ЕОХ, 0 
му ех1 

МОУ ЕСХ. ЕБХ 

пехё1: 


му — АХ. мога рег Г[ЕЗГ] 
1ти]  мюга рек [ЕОГ] 
ту — мог рёг [ЕВХ]. АХ 


поу — мога рёг [ЕВХ+2]. ОХ продолжение „2 
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Листинг 12.18 (продолжение) 


а94 ЕЗТ, 2 

ада ЕСТ, 2 

ааа ЕВХ. 4 

дес ЕСХ 

72 пехё1 
ех1%: 

1еа ЕАХ. гез 

геё 
метру ех епар 
епа 


Наша процедура может использовать массивы 16-разрядных чисел произволь- 
ного размера. При этом для выполнения ММХ-команд умножения удобно разбить 
элементы массивов на группы по 4 слова, а оставшиеся элементы обработать 
обычным образом. Для этого нужно установить в счетчики циклов соответствую- 
щие значения, что и выполняют команды 


оу  ЕАХ. 1еп 


$г  ЕАХ, 1 
оу ЕВХ, 4 
хог ЕОХ. ЕОХ 
Чу  ЕВХ 


После выполнения этих команд регистр ЕСХ будет содержать количество 8-бай- 
товых групп элементов, а регистр ЕБХ — количество оставшихся элементов. 

Как обычно, перед началом цикла загружаем в регистры ЕЗТ, ЕБГ и ЕВХ адреса 
всех массивов с помощью команд Теа. Далее начинается обработка элементов 
массива в цикле пех. С помощью следующих команд вычисляются старшие сло- 
ва 4-словных произведений элементов массивов а1 и а2: 

поуд  ММЬ. дмога рег [Е$Г] 

лоу ММО. дмога рег [ЕОГ] 

ртиуТИм ММО. ММ1 

Результаты произведений помещаются в регистр ММО. Содержимое регистра 
ММ1 после выполнения операции остается неизменным, чем мы воспользуемся 
в дальнейшем. Смысл произведенных действий иллюстрирует рис. 12.21, на кото- 
ром показано вычисление старших слов произведений с помощью команды 


рту]им ММО. ММ1 
ртийм ММО, ММ1 


63 15 0 
х 63 15 0 


и 

© 

[2 
<— 
<— 
<— 

я 
<— 

>) 


Нов М/ога 1 | Ноп М/ога 21 НК М/ога 3 | НУВ У/ога 4| ММО 


Рис. 12.21. Вычисление старших слов произведений командой рти\ 
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Чтобы получить младшие слова произведения, выполняются команды 


поуа  ММ2, Чмога рёг [ЕОГ] 
рти11м ММ]. ММ2 


После выполнения этих команд результаты находятся в регистре ММ1. Это ил- 
люстрирует рис. 12.22. 


рти!м ММ1, ММ2 


63 15 0 
х 63 15 0 


и 

© 

[2 
<— 
<— 
<— 

я 
<— 

>) 


ом М/огд 1 | Коми М/огд 2 | Томи М/огд 3 | Воми У\ога 4 | ММ1 


Рис. 12.22. Вычисление младших слов произведения командой рти№ 


Таким образом, после попарного умножения четырех слов из массивов а] и а2 
старшие слова результатов находятся в регистре ММО, а младшие слова этого же 
произведения — в регистре ММ1. 

Следующий шаг, который нужно сделать, — объединить старшую и младшую 
части результатов и поместить полученные значения в массив гез;: 

моуа  ММ2. ММО 

поуд ММЗ. ММ1 

рипрсКИма ММЗ. ММ2 

рипрсК1ма ММ]. ММО 

мо  Чмога рег [ЕВХ]. ММ1 

ОУ  Чмога рег [ЕВХ+8]. ММЗ 


Алгоритм работы команд рипрскИм@ и рипрсК1м@ мы уже рассматрели, смысл 
остальных команд достаточно очевиден, и я не буду на них останавливаться. 

После выполнения всех итераций в цикле пехё оставшиеся элементы обраба- 
тываются обычными командами в цикле пехё1. Хочу заметить, что для умноже- 
ния 16-разрядных элементов в этом цикле используется команда 1ти1 (элементы 
массива считаются числами со знаком). Процедура возвращает результат в реги- 
стре ЕАХ, в который помещается адрес массива гез. 

Тестирование процедуры можно выполнить с помощью программы на \!5иа! 
С++ МЕТ (листинг 12.19). 


Листинг 12.19. Демонстрационная программа для процедуры из листинга 12.18 
фас1цае <5Е910.1П> 

ехегп "С" 1пё* м Ир1у_ех(\у019): 

1тё татп(уота) 


11е* рт = ми 1р1у ех(): 
риТпЕ("МАСТТРЕТСАТТОМ ехатр1е:\п”); 
Фог(1пё 11 = 0: 11 < 11;11++) продолжение 7 
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Листинг 12.19 (продолжение) 


{ 
рг1пЕТ("%а ". *рт++); 
} 


гефигп 0: 
} 

При заданных значениях элементов массивов программа выводит на экран 
следующие результаты: 

МИСТТРЕТСАТТОМ ехатр1е: 

-408 -168 -1508 2093 335 8694 -69639 5368 5537 450 -159598 

В команде рта ма для реализации умножения используется несколько другой 
подход. Лучше всего продемонстрировать это на практике. Следующий пример 
показывает, как с помощью команды ртаддид можно умножить две пары двойных 
чисел. Процедура называется _ртаддиа_ех, и ее исходный текст занимает всего не- 
сколько строк (листинг 12.20). 


Листинг 12.20. Умножение двойных чисел при помощи команды рта мА 


‚ 686 

.тоде] 11а 

„ММХ 

орЕ1оп сазетар: попе 
.Чата 

а1 00 5893. -4592 
а2 00 5275.5565 


гез 09 0 

.соде 

_ртабама ех ргос 
]еа ЕЗГ. а1 
Теа ЕОТ. а2 
Теа ЕВХ. гез 


ОУ ММО. адмога рёг Г[ЕЗГ] 
рма4ич ММО. дмога рег [ЕОТ] 
моуа @мога рёг [ЕВХ]. ММО 


Теа ЕАХ. гез 
ге 

_ртааама_ех епар 

епа 


Как обычно, процедура возвращает результат в регистре ЕАХ, куда помещается 
адрес массива гез. Для вывода численных результатов можно воспользоваться 
программой, исходный текст которой представлен в листинге 12.21. 


Листинг 12.21. Демонстрационная программа для процедуры из листинга 12.20 


ЯисТие <$4910.1> 
ехёегп “С” 1п%* рмадаиа_ех(\014): 
11 ма1п(\01а) 


{ 

116* ртаддм@ = рта@ама_ех(): 
рг1иЕ( "РМАСОИО :\п”): 
реп {( "4 ". *ртадама++):; 
ретпёР("%а\п". *рта@диа); 
гефигп 0; 
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При указанных значениях элементов массивов а! и а2 в процедуре _ртади4_ех 
программа выводит на экран значения 31 085 575 и —25 554 480. 

На этом рассмотрение команд умножения можно закончить и перейти к ана- 
лизу команд сравнения. 


12.6. Команды сравнения 


ММХ-команды сравнения попарно сравнивают элементы данных (байты, 16- или 
32-разрядные слова) входного и выходного операндов. В зависимости от резуль- 
тата сравнения соответствующий элемент данных выходного операнда заполня- 
ется нулями либо единицами. Эти команды, как и все остальные ММХ-команды, 
не устанавливают флагов (признаков). В свою очередь, они делятся на две груп- 
пы: команды обычного сравнения (равно или не равно) и команды сравнения по 
величине (больше или меньше). Операции сравнения проводятся для упакован- 
ных байтов, слов и двойных слов. 
К командам сравнения относятся: 


® рстредь, рстреди, рстредй — попарное сравнение элементов данных (байтов, 
16- или 32-разрядных слов) входного и выходного операндов. Если эле- 
мент данных выходного операнда равен соответствующему элементу вход- 
ного, такой элемент выходного операнда заполняется единицами. Если 
элементы не равны, то он заполняется нулями. Входным операндом могут 
выступать ММХ-регистр или ячейка памяти, а выходной операнд должен 
находиться в ММХ-регистре; 


® ретрофь, рстрофи, рстраёа — попарное сравнение элементов данных (байтов, 
16- или 32-разрядных слов со знаком) входного и выходного операндов. 
Если элемент данных выходного операнда больше соответствующего эле- 
мента входного, такой элемент выходного операнда заполняется единица- 
ми, если же он не больше входного, то он заполняется нулями. Входной 
операнд может находиться в ММХ-регистре или в памяти, а выходной опе- 
ранд — в ММХ-регистре. 

Для операций обычного сравнения нулевые значения формируются, если со- 
ответствующие байты, слова или двойные слова не равны. Единичные значения 
формируются в случае, если соответствующие байты, слова или двойные слова 
равны. Для операций сравнения по величине единичные значения формируются, 
если соответствующие байты, слова или двойные слова первого операнда больше 
соответствующих байтов, слов или двойных слов второго операнда. 

Лучше всего работу команд сравнения можно проиллюстрировать на приме- 
рах. В листинге 12.22 приводится исходный текст процедуры на ассемблере (она 
называется _рстредд ех), выполняющей сравнение по принципу «равно или не 
равно» двухсловных элементов целочисленных массивов. 

Процедура принимает три входных параметра: два из них являются адресами 
сравниваемых массивов, а третий содержит размер массивов в байтах. Мнемони- 
чески процедуру _рстреда_ех можно представить так: 


рстреда ех(адрес_массива_1. адрес_массива_2. разнер) 
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Листинг 12.22. Сравнение элементов целочисленных массивов на равенство/неравенство 


.686 
„поде] Ра% 
„ММХ 
сорёТоп сазетар: ‘попе 
.Чата 
гез 00 10 ШР (0) 
.соде 
_ремредазех:ргос 
призй ЕВР 
“МОУ ЕВР. ЕР 
МОУ ЕСХ. амога рег [ЕВР+16) 
тЯИГ ЕбХ. 3 
ПУ ЕЗТ, мога рег ТЕВР+8] 
`ПОУ ЕТ. -иога рёг_ГЕВР+12) 
“Теа ЕВХ. гез 
пех: 
уд ММО. дмога рЕгТЕЗИ 
трстреда ММО. дмогЧ рег ГЕОГ] 
`МОУа ога рег [ЕВХ]. ММО 


;894 ЕЗТ. 8 
;994 ЕОТ. _В 
;999 ЕВХ. 8 
дес ЕСХ 
ЗПР пехё 
“Теа ЕАХ. гез 
рор ЕВР 
ге 
_рстреда_ех епар 
епа 


Для упрощения программного кода полагаем, что массивы имеют четное ко- 
личество двойных слов и одинаковы по размеру. 

Результат сравнения (единицы или нули в операнде-приемнике) помещается 
в массив результата ге, адрес которого возвращается в вызывающую программу 
в регистре ЕАХ. 

Адреса массивов в регистры ЕЗТ, ЕБТ и ЕВХ загружают команды 

поу ЕЗТ. амога рег [ЕВР+8] 

моу ЕОТ, дога рег [ЕВР+12] 

Теа ЕВХ. гез 

Регистр ЕСХ после выполнения следующих команд содержит количество пар 
двойных слов и является счетчиком цикла, в котором будет выполняться сравне- 
ние элементов массивов: 


оу ЕСХ. Чмога рег ГЕВР+16] 
5Иг ЕСХ. 3 


Операция сравнения осуществляется с использованием команды 
рстреса ММО. дмога рег [ЕТ] 
Эта команда выполняется в каждой итерации цикла: 


пехё: 
ее] ММО. Чмога рег [Е 
ретреаа ММО. дмога рёг [ЕОТ] 
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оУд Чмога рег [ЕВХ]. ММО 
2 пех 


Протестировать процедуру можно с помощью приложения на \У}5а] С++ МЕТ 
(листинг 12.23). 


Листинг 12.23. Демонстрационная программа для процедуры из листинга 12.22 
ЯНпс1иае < а10.1> 

ехбеги "С" 1п%* рстред@ ех(1пё* а1. 1п%* а2. 1иЕ соипеег); 

116 ма1п(у01а)} 


11 а{|] == { 345. 87. -455. 1[2.--5439, 99}: 
116 а2|.]== { 345. 87. -455. [2.--5439. 98}: 
176 соцпеог = $17е01(а2): 

Бюо? 11Тад =“ гие; 

11е* ра = ротред ех(а1. аг, ссоитег): 

Фог (106 -11== 0; 11 <-:6; 11 ++) 


{ 
ТЕ ра == ОХРЕЕЕЕЕЕЕ) 
{ 


ра+: 
} 


е15е 


{ 
ад = 1а1зе: 
Ьгеак; 


} 
} 
17 (Рад) 
ри1иЕ?( "ОРЕВАМО$ АВЕЗЕОЦА! п") 
е15е 
ри1ипЕ("ОРЕКАМО$ АВЕ МОТ ЕСЦАЕ! п"); 
гебиги 0: 


} 


Поскольку последние элементы массивов а] и а2 различаются, то результатом 
будет выведенная на экран строка: 


ОРЕКАМО$ АВЕ МОТ ЕСЦАЫ! 


Результат сравнения последних пар двойных слов в процедуре _рстреда_ех по- 
казан на рис. 12.23. 


рстреда ММО, дмгогд ри [ЕС] 


000000001 РЕЕЕЕЕЕЕВ 


Рис. 12.23. Результат сравнения последних пар элементов 
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Если в рассмотренном только что примере определялось лишь равенство/не- 
равенство элементов, то следующий пример демонстрирует соотношение между 
операндами, исходя из их значений. В этом примере демонстрируется использо- 
вание команды рстрофа. В листинге 12.24 представлен исходный текст процедуры 
_рстраеЧ_ех, выполняющей сравнение элементов массивов а1 и а2. 


Листинг 12.24. Сравнение элементов массивов по их значениям 


.686 

„тоде] Рае 

„ ММХ 

орЕ1оп сазетар: попе 

„дата 

гез 00 10 МР (0) 

.соде 

_ретраё4_ех ргос 
рип ЕВР 
тоу ЕВР. ЕЗР 
му ЕСХ. Чмога рёг [ЕВР+16] 
$Иг ЕСХ. 3 
ет ЕЗГ. дога рёг [ЕВР+8] 
поу ЕОГ. дога рёг [ЕВР+12] 
Теа ЕВХ. гез 

пехё: 
Шей ММО. амога рёг [ЕЗГ] 
ретраёЧ ММО, дмога рег ГЕОТ] 
мод Чмога рег ГЕВХ]. ММ0 


аа Е51. 8 
аа ЕОТ. 8 
а94 ЕВХ. 8 
дес ЕСХ 
72 пех 
Теа ЕАХ. гез 
рор ЕВР 
ге 
_рстро*4_ех епар 
епа 


Исходный текст данной процедуры похож на текст предыдущей, за исключе- 
нием того, что используется другая команда сравнения (в тексте процедуры она 
выделена жирным шрифтом): 


рстраёа ММО, дмога рёг [Е0Т] 


Хочу сделать одно важное замечание: команды рстрое работают со знаковыми 
операндами. Вызывающая программа на \У15ща| С++ МЕТ отображает содержи- 
мое результирующего массива гез (в шестнадцатеричном формате), куда поме- 
щаются двойные слова, содержащие нули или единицы, в зависимости от резуль- 
тата сравнения (листинг 12.25). 


Листинг 12.25. Демонстрационная программа для процедуры из листинга 12.24 
Нпс1цае <5%91о.1> 

ехёегп "С" 1тё* рстрофа ех(1пё* а1. 1пё* а2. 1пё соипеег); 

11 ма\п(уо1а) 
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11% а1(] = { 345, 87. -479, 12. -5459. 100}: 
116 а2[] = { 345. 87, -480. 12. -5469, 99}: 
1и8 соцпбег = $12е01(а2); 

рг1пЕТ("РСМРЕТО ехатр1е:\п"); 

11%* рде = рстрдф@ ех(а1, а2, соитфег); 
Тог(1пе 11 =0; 11 <6; 11++) 


реТиЕР( "ХА ^. *раё++): 
} 


гефигп 0: 


При указанных значениях элементов массивов программа выводит на экран 
следующий результат: 

РСМРЕТО ехатр1е: 

Он Он РЕРЕЕЕЕРИ Он ЕРЕРРЕРЕВ РЕРРЕРЕРИ 

Такой результат является закономерным, поскольку 2, 4 и 5-й злементы мас- 
сива а1 больше соответствующих элементов массива а2. 


12.7. Логические команды 


Логические ММХ-команды выполняют поразрядные логические операции над 
всеми 64 битами своих операндов. Они реализуют логические операции И, ИЛИ, 
И-НЕ, исключающего ИЛИ: 


® рапд (логическое И) — вычисляет поразрядное логическое И своих операн- 
дов. Входной операнд может быть ММХ-регистром или операндом в памя- 
ти. Выходной операнд должен находиться в ММХ-регистре; 


® рапдп (логическое И-НЕ) — вычисляет обращение (поразрядное НЕ) вы- 
ходного операнда, а затем поразрядное логическое И между входным опе- 
рандом и обращенным значением выходного. Входным операндом могут 
выступать ММХ-регистр или ячейка памяти. Выходной операнд должен 
находиться в ММХ-регистре; 


® рог (логическое ИЛИ) — вычисляет поразрядное логическое ИЛИ своих 
операндов. Входной операнд может находиться в ММХ-регистре или в ячей- 
ке памяти. Выходной операнд должен быть ММХ-регистром; 


® рхог (исключающее ИЛИ) — вычисляет поразрядное логическое исключаю- 
щее ИЛИ своих операндов. Входной операнд может содержаться в ММХ- 
регистре или в ячейке памяти. Выходной операнд должен находиться в ММХ- 
регистре. 


Работа команд достаточно очевидна, поэтому перейдем к примерам. В листин- 
ге 12.26 показан исходный текст процедур, выполняющих логические операции 
над двумя операндами, являющимися входными параметрами для этих процедур, 
причем все процедуры возвращают адрес массива в регистре ЕАХ. 
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Листинг 12.26. Применение логических команд 


.686 
„тю4де] #1а& 
ор1оп сазетар:попе 
„ММХ 
„Даса 
тез 00 0 
.соде 
_рапа -ех:ргос 
тризи ЕВР 
“тоу ЕВР. 1Е5Р 
“пуд ММО, -дмога рег ЕВР+8] 
грапа ММО, -диога рёг`ТЕВР+16] 
`оУЧ Чмога рёг гез, ММО 
Теа ЕАХ, ‘гез 
`рор ЕВР 
ге 
_рапа зех=спор 
_рапап_ех ргос 
ризй ЕВР 
“моу  ЕВР, ЕЗР 
`моуЧ ММО, дмога-раг [ЕВР+8] 
рапап ММО, дмога-рег [ЕВР+Т6] 
оу Чмога рег вй$. ММО 
12а  ЕАХ, гез 
рор ЕВР 
ге 
_рапап ех епар 
_рогаех:ргос 
ризп ЕВР 
“ЮУ ЕВР. ЕЗР 
`поУа ММО. дмога рёг [ЕВР+8] 
рог ММО. 9мог4 рёг [ЕВР+16] 
“Под диог@ рёг гез, -ММо 
1еа ЕАХ. гез 
рор ЕВР 
ге 
_рог_ех епар 
‚рхог =ехргос 
`ризн ЕВР 
“тоу ЕВР, ЕР 
-мома ММО, дногц рег [ЕВР+8] 
рхог ММО. омогА рёг [ЕВР+16] 
“оу дог рег гез, ММО 
1еа ЕАХ, гез 
рор ЕВР 
зая 
_рхог_ех епар 
епа 


Каждая из процедур (_рапд_ех, _рапап_ех, _рог_ех, _рхог_ех) получает через ре- 
гистр ЕВР два 64-разрядных значения, после чего выполняет над ними соответст- 


вующие операции при помощи команд рапа, рапдп, рог и рхог. 


Для проверки работоспособности процедур можно использовать программ- 


ный код, написанный на У!5ца| С++ МЕТ (листинг 12.27). 
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Листинг 12.27. Демонстрационная программа для процедур из листинга 12.26 
ЧАпсТиае <5%10.1> 

ехёегп ”С" 1опд 10п9* рапд_ех(1опд 1019 а1. 10п9 1019 Ь1): 

ехфегп ”С” 1опд 10п9* рапап_ех(1опд 1019 а1, 1опд 1опд 1); 

ехбегп ”С” 10пд 10п19* рог_ех(Топд 1019 а1. 1опд 1опд Ь1): 

ехёеги “С” 1019 10п9* рхог_ ех(1опд 10п9 а1. 1019 10п9 61): 

11% та1п(у014) 


Топд 1019 а1 = 0Х7АЕ1; 

Топд 10п9 Б1 = 0хС080; 

рг1пЕР( "РАЮ: %Х\п". *рапа_ех(а1, Б1)): 
ргТиЕ+Р( "РАМОК: ЖХ\п”. *рапдп_ех(а1, 51)); 
риТПЕТ( "РОК: #Х\п". *рог_ех(а1. 61)): 
рг1пЕ("РХОВ: %Х\п", *рхог_ех(а1, 61)): 
геигп 0; 


Обратите внимание на то, что все параметры и возвращаемые значения в этой 
программе объявлены как 1019 1019 — это объявление для 64-разрядных величин 
в У1виа| С++ МЕТ. Все процедуры объявлены как внешние директивой ехееги. 

При указанных значениях переменных а1 и Б1 (выделены жирным шрифтом) 
программа выводит на экран следующие результаты: 

РАМО: 4880 

РАМОК: 8500 


РОВ: РЕЕ1 
РХОВ: В761 
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ММХ-команды сдвига выполняют сдвиг каждого элемента данных (16-, 32- или 
64-разрядного слова) в выходном операнде на величину, задаваемую входным 
операндом. Среди команд сдвига выделяют команды арифметического и логи- 
ческого сдвига. При выполнении команд арифметического сдвига освобождающие- 
ся разряды элементов заполняются знаком числа (старший бит) и могут принимать 
значение как 0, так и 1, в то время как при выполнении команд логического сдвига 
освободившиеся разряды заполняются нулями. К этой группе относятся следую- 
щие команды: 


® р$11м, р5114, р5114 — сдвиг элементов данных (16-, 32- или 64-разрядных 
слов) в выходном операнде на число битов, задаваемое входным операндом. 
Освободившиеся младшие разряды заполняются нулями. Входной операнд 
может быть непосредственным операндом либо находиться в ММХ-регист- 
ре или в памяти. Выходной операнд должен находиться в ММХ-регистре; 


® рег|м, руг1а, рзг1а — сдвиг элементов данных (16-, 32- или 64-разрядных 
слов) в выходном операнде на число битов, задаваемое входным операндом. 
Освободившиеся старшие разряды заполняются нулями. Входной операнд 
может быть непосредственным операндом либо находиться в ММХ-регист- 
ре или в памяти. Выходной операнд должен находиться в ММХ-регистре; 
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®» рогам, рзга@ — сдвиг злементов данных (16- или 32-разрядных слов) в вы- 
ходном операнде на число битов, задаваемое входным операндом. Если 
сдвигается положительное число, то освободившиеся: старшие разряды за- 
полняются нулями, если отрицательное, то единицами. Входной операнд 
может быть непосредственным операндом либо находиться в ММХ-регист- 
ре или в памяти. Выходной операнд должен находиться в ММХ-регистре. 


Работа этих команд иллюстрируется программным кодом процедур из ли- 
стинга 12.28. 


Листинг 12.28. Применение команд сдвига 


.686 
„тоде? #1аё 
орЕ1оп сазетар: попе 
„ММХ 
„дата 
гез 090 
.соде 
_р$11_ех ргос 
рип ЕВР 
поу  ЕВР. ЕЗР 


оу ММО, дмога р®г [ЕВР+8] 
р$1149 ММО. Чиога рёг [ЕВР+163 
поУЧ Чмогд рфг гез. ММО 


Теа  ЕАХ. гез 
рор  ЕВР 
ге 


_р$114_ех епар 
_рзг19_ех ргос 
ризп ЕВР 
пои  ЕВР, ЕЗР 
лоуа ММО, диога рег [ЕВР+8] 
р$гТа ММО. Чмога рёг ГЕВР+16] 
оу дмога рёг гез. ММО 
1еа  ЕАХ. гез 
рор  ЕВР 
ге 
_рзг1а_ех епар 
_рзгад_ех ргос 
ризп ЕВР 
пои  ЕВР. ЕЗР 
оу ММО, дога р%г [ЕВР+8] 
рзгад ММО, чмога рег [ЕВР+16] 
ЮУ Чмога рёг гез. ММО 
1еа  ЕАХ, гез 


рор ЕВР 

ге 
_рзга@_ех епар 
епд 


В листинге представлен исходный текст процедур, демонстрирующих особен- 
ности операций логического сдвига двойных слов и арифметического сдвига слов. 
Процедура _р5114_ех показывает работу команды р$114, процедура _рзг1а_ех'— 
команды р$г14 и, наконец, процедура _рзгад_ех — команды рзгада. Все процедуры 
в качестве параметров принимают исходное значение операнда по адресу [ЕВР+8] 
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и величину сдвига ([ЕВР+16]). Процедуры возвращают результат обычным обра- 
зом, через регистр ЕАХ, в который помещается адрес переменной ге$ с полученным 
значением. 

Визуальное отображение полученных результатов позволяет получить про- 
стая программа на \У15иа] С++ .МЕТ (листинг 12.29). 


Листинг 12.29. Демонстрационная программа для процедуры из листинга 12.28 


МисТиде <$44910.1> 

ехёегп "С" 10пд 10п19* р$119_ех(10пд 1019 а1. 1019 10п9 $ИТ): 
ехбеги “С” 1019 10п9* рзг19_ех(1опд 1опд а1. 1019 1опд $170); 
ехфегп "С" 10пд 10п19* рзгад_ех(1ойд 1019 а1. 1опд 1оп9 $10): 
Ти ма1п(у014) 


1Топд 10п9 а1 = Ох9РЕЕЕЕЕЕ; 

Топд 1019 $Н = 2; 

рг1и ("РЗ 0: 3Х\п". #р$114_ех(а1. $ПТе)):; 
рглиЕТ("РЗВЕЦ: &Х\п", *р$г14_ех(а1. $116)): 
рг1иЕР("РЗКАО: ЖХ\п". *рзгад ех(а1. $176)); 
гефиги 0: 


Программа выводит содержимое 64-разрядных значений (спецификатор 1019 
1019) в шестнадцатеричном формате (спецификатор Х). Для указанного значе- 
ния переменной а1 (0х9ЭРЕЕЕЕЕЕ) результаты работы программы будут вы- 
глядеть так: 

294.0: 7ЕЕЕРЕРСВ 

Р5ВЕ0: 27ЕЕРЕЕЕЙ 

РУВАО: Е7ЕЕЕРЕРИ 

Полученные результаты легко интерпретируются с помощью схемы на рис. 12.24. 
Здесь старшая часть 64-разрядных операндов изображена в уменьшенном виде, 
а биты младшей части представлены полностью. 


Работа команды р$Иа ММО, 2 при ММО = ЭРРЕЕЕЕЕИ 


Содержимое регистра ММО до операции Содержимое регистра ММО после операции 


004 1414 1111 1141 1141 11114 1141 1111 010 0141 4141 4111 1141 1141 1411 1141 
31 0 31 0 





Работа команды рз1а ММО, 2 при ММО = ЭРРЕРЕРЕК 


Содержимое регистра ММО до операции Содержимое регистра ММО после операции 


1001 1111 1141 1141 1111 1144 1141 4141 |[:2:2]0010 0141 1111 1111 1141 1111 1141 1111 
31 01 0 





Работа команды рзгад ММО, 2 при ММО = ЭЕРЕРЕЕРЕК 


Содержимое регистра ММО до операции Содержимое регистра ММО после операции 


41001 14114 1411 1411 1141 1141 1141 1111 г: 1110 0111 1141 1111 1111 1141 1141 1141 
31 0 31 0 


Рис. 12.24. Функционирование команд сдвига 
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12.9. Дополнительные команды 


Сейчас мы рассмотрим еще одну группу команд, которые трудно отнести к како- 
му-либо определенному типу, но которые являются весьма полезными при разра- 
ботке программ. Эти команды включены во все поколения процессоров Шие| 
Репиит, начиная с Репиит 11. Вот некоторые из них: 


рамдь, рауди — вычисляют среднее значение двух чисел, представленных 
байтами или словами. Значения операндов интерпретируются как без- 
знаковые целые числа. В качестве входного операнда могут выступать 
ММХ-регистр или 64-разрядная ячейка памяти, выходным операндом слу- 
жит один из ММХ-регистров; 


рех{гм — извлекает одно из четырех упакованных слов входного операнда. 
Команда имеет три аргумента: входной операнд, выходной операнд и мас- 
ка. Младшие два бита маски задают во входном операнде номер упако- 
ванного слова, подлежащего извлечению. Извлеченное слово сохраняется 
в младшем слове выходного операнда. Выходным операндом этой команды 
может выступать один из 32-разрядных регистров общего назначения. 
Старшее слово выходного операнда обнуляется; 


р1пзгм — вставляет слово в одно из четырех упакованных слов выходного 
операнда. Выходным операндом является один из ММХ-регистров, а вход- 
ным операндом может выступать один из 32-разрядных регистров общего 
назначения, младшее слово которого будет вставлено в выходной операнд. 
Номер позиции, куда помещается операнд, определяется младшими двумя 
битами маски и может принимать значения от 0 до 3; 


ртахиб, ртах$и — извлекают максимальное значение из каждой пары упакован- 
ных злементов в выходном и входном операндах. Операции могут выпол- 
няться как над беззнаковыми байтами (ртахиб), так и над знаковыми словами 
{ртахзм). В качестве выходного операнда может выступать ММХ-регистр, 
а в качестве входного — ММХ-регистр или 64-разрядная ячейка памяти; 


рийпиб, ри1изи — извлекают минимальное значение из каждой пары упакован- 
ных элементов в выходном и входном операндах. Операции могут выпол- 
няться как над беззнаковыми байтами (ри пиб), так и над знаковыми словами 
{рт1и$м). В качестве выходного операнда может выступать ММХ-регистр, 
а в качестве входного — ММХ-регистр или 64-разрядная ячейка памяти; 


ртоутзКЬ — формирует байт, содержащий знаковые биты восьми байтов, со- 
держащихся во входном операнде, в качестве которого может выступать 
один из ММХ-регистров. Выходным операндом является 32-разрядный 
регистр общего назначения, младший байт которого будет содержать ре- 
зультат. Эта команда очень удобна для формирования условных ветвлений 
в программах; 


рза@Бм — вычисляет суммарную разность значений беззнаковых байтов 
входного и выходного операндов. Входным операндом могут выступать 
ММХ-регистр или 64-разрядная ячейка памяти, а выходным — один из 
ММХ-регистров. 
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Рассмотрим пример использования команд ртахзм. Здесь вычисляется макси- 
мальное значение из пар 16-разрядных чисел со знаком, содержащихся в масси- 
ваха1 и Б1. Процедура (она называется ртахзи ех) на ассемблере выглядит так, как 
показано в листинге 12.30. 


Листинг 12.30. Вычисление максимальных значений пар целых чисел со знаком 


.686 
„тюде Та+ 
„ММХ 
ор1оп сазетар: попе 
.дафа 
а1 ОМ 45. -67. 23, 11 
Ь1 ОМ -671. 223, 3. 155 
гез 000 
.соде 
ртахзм_ех ргос 
ЮУ ММО. чмога рёг а1 
ртах$и ММО. дмога рег Ь1 
ЮУ  Чмог@ рёг гез. ММО 
Теа ЕАХ. ге$ 
ге 
ртахзм_ех епар 
епд 


Исходный текст процедуры несложен, и нет необходимости его анализировать. 

На этом обзор возможностей команд ММХ-расширения можно закончить. 

Я надеюсь, что материал главы окажет помощь программистам в разработке 
сложных и эффективных программ. 


55Е-расширение 
процессоров ше! 
Репйит 





В этой главе рассматриваются вопросы использования 55Е-расширения при 
разработке приложений на ассемблере. Это расширение, впервые появившееся 
в процессорах ие! Репйит Н1, дополняет ММХ-расширение средствами обра- 
ботки данных с плавающей точкой. 

$5Е-расширение реализовано в виде аппаратно-программного модуля, ко- 
торый включает дополнительные восемь регистров разрядностью в 128 бит, 
имеющих обозначение ХММО — ХММ7, и 32-разрядный регистр управления/состоя- 
ния МХСЗК (рис. 13.1). 


127 0 
хммо 
ХММ1 
хммМ2 
ХММЗ 
ХММ4 
ХММ5 
хммб 
ХММ? 


31 0 


ПИН 2. 


Рис. 13.1. Аппаратная модель 5$Е-расширения 


Программная часть $5Е-расширения включает в себя набор 5ЗЕ-команд для 
работы с данными в формате плавающей точки. Содержимое ХММ-регистра 
представляет собой четыре 32-разрядных операнда с плавающей точкой в ко- 
ротком формате (Зше Ргес1$1юп Е]оацпя Рошь, ЗРЕР). Представление дан- 
ных $5Е-расширения соответствует стандарту 1ЕЕЕ-754, а сам формат данных 
показан на рис. 13.2. 
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127 95 63 31 0 









31 30 23 22 


Рис. 13.2. Формат данных $$Е-расширения 


Здесь мантисса (тапИзза) и порядок (ехропеп() формируют число в формате 
ЗРЕР в соответствии с формулой 


мантисса х 27°рялок 


Диапазон изменения чисел, представленных в данном формате, равен 2-126—2177. 

Следует отметить, что данный формат данных несопоставим с тем, который 
принят для математического сопроцессора (число в 80-разрядном расширенном 
формате), поэтому в некоторых случаях при разных границах выравнивания ре- 
зультаты вычислений с использованием форматов ЕР и 55Е могут различаться. 

Поскольку аппаратно модуль 55Е-расширения реализован независимо от 
других модулей, то это позволяет выполнять 55Е-команды параллельно с коман- 
дами математического сопроцессора и ММХ-командами. При этом для синхро- 
низации вычислений инструкции наподобие ет не требуются. 

Структура полей регистра управления/состояния (МХСЗВ) во многом напоми- 
нает ту, что реализована в регистрах состояния ($мг) и управления (сиг) матема- 
тического сопроцессора. Состоянием вычислений можно управлять путем уста- 
новки определенных значений в поля этого регистра. 

Набор инструкций 55Е-расширения включает 70 команд. Подробное описа- 
ние всех 55Е-команд — это тема отдельной книги, поэтому я приведу описание 
и примеры использования только части из них. Для более глубокого изучения 
архитектуры 35Е и практического применения команд можно воспользоваться 
фирменным руководством Пие] по процессорам Репёит Ш и выше. 

Значительная часть команд может выполняться в двух контекстах: скалярном 
и параллельном. Это относится к арифметическим командам, а также к командам 
сравнения. Команды параллельных арифметических операций обрабатывают од- 
новременно 4 двойных слова и имеют в своей мнемонике суффикс рз (рис. 13.3). 

Команды скалярных операций обрабатывают только младшие 32-разрядные 
двойные слова упакованных операндов, не затрагивая при этом три старших 
двойных слова. Исключение составляют некоторые команды скалярной пере- 
сылки данных. Мнемоническое обозначение этих команд включает суффикс 55, 
схема их выполнения показана на рис. 13.4. 
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Выполнение команд параллельных операций 


(суффикс р) 
127 95 63 31 0 
операция операция операция операция 
127 95 


63 31 0 


Рис. 13.3. Схема выполнения команд параллельных операций 


Выполнение команд скалярных операций 
(суффикс $$) 
63 31 


— 


27 


© 


операция 


95 
127 95 63 31 0 


Рис. 13.4. Схема выполнения команд скалярных операций 


Рассмотрим важнейшие группы команд 55Е-расширения и методику их ис- 
пользования. Напомню, что для тестирования программного кода, представлен- 
ного в этой главе (как и предыдущей), понадобится компилятор ассемблера фирмы 
Мгсгозой версии 7.10.хххх или любой другой, поддерживающий 55Е-команды. 

В процессе обработки данных команды 55Е-расширения могут возбуждать 
исключительные ситуации, которые возникают, если происходит одно из сле- 
дующих событий: 


» некорректная операция (шуаНЯ орегайоп); 

» денормализованный операнд (4епогтаН2е4 орегап4); 
»› Деление на 0 (Ч1у14е-Бу-2его); . 

» арифметическое переполнение (питегс оуегЙо\);. 

» потеря значащих разрядов (питег!с ип4дегЙо\); 

» потеря точности (шехасё гези!‹). 


При возникновении исключительных ситуаций устанавливаются биты 0-5 
в регистре управления/состояния (МХС$В). Каждая исключительная ситуация 
может быть замаскирована путем установки в 1 битов 7-12 регистра МХСЗВ. 
Если какое-либо исключение замаскировано, то оно обрабатывается процессо- 
ром по стандартному алгоритму, после чего продолжается выполнение про- 
граммного кода. Формат полей регистра МХС$К и их назначение показаны на 
рис. 13.5. 
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Регистр управления/состояния МХС$К 
31 15 14 13 12 11109 878543210 












Заразервированы 


Флаги исключитвльных 
ситуаций 





Заразарвирован 





Биты маски исключительных ситуаций 





Установка режима округления 





Бит перехода к нулю 


Рис. 13.5. Регистр управления/состояния 


Биты 13-14 регистра МХС$В поля ВС (или гс, что одно и то же) задают режим 
округления. По умолчанию устанавливается режим округления к ближайшему 
значению числа с плавающей точкой в коротком формате. Эти биты можно уста- 
новить программно, причем возможны следующие комбинации: 


® 00 — округление к ближайшему числу; 

®» 01 — округление к меньшему числу; 

®е 10 — округление к большему числу; 

® 11 — округление с отбрасыванием дробной части. 


Бит 15 используется, если результат операции близок к нулю. При этом про- 
цессор выполняет следующие действия: 


®» возвращает значение 0 и знак результата; 
® устанавливает флаги Р (бит 5) и (Ц (бит 4); 
® маскирует биты исключений. 


Программная реализация $3Е-расширения включает несколько десятков ко- 
манд. Все их условно можно разделить на несколько групп: 


® команды передачи данных; 
® арифметические команды; 
® команды сравнения; 

® команды преобразования; 
®» логические команды; 

®» дополнительные команды. 


Прежде чем приступить к анализу 55Е-команд, следует определить, под- 
держивает ли данный процессор 5ЗЕ-расширение. Это необходимо для того, что- 
бы узнать, можно ли использовать команды $5Е-расширения при разработке 
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программ. Такую проверку можно выполнить при помощи простой процедуры 
(она называется _5зезиррогЕ), код которой представлен в листинге 13.1. 


Листинг 13.1. Тест процессора на поддержку 55Е 


. 686 


.моде1 Раф 
орё1оп сазетар: попе 


„дата 


Зир55Е ОВ 1 


.соде 


_$зезирроге ргос 


мо 


ЕАХ, 1 


сритд 
{ез+ ЕОХ. 20000008 


12 
оу 
ех1{: 
хог 
оу 
ге 


ех1 
зирз5Е. 0 


ЕАХ. ЕАХ 
АЕ. $ир5Е 


_$5езиррог& епар 


епд 


Процедура возвращает в регистре А! единицу, если процессор поддерживает 
$3Е-расширение, и 0, если не поддерживает. 

Приступим к анализу отдельных групп команд и начнем с команд передачи 
(пересылки) данных. 


13.1. Команды передачи данных 


В группу команд передачи данных входит несколько команд, позволяющих вы- 
полнять операции над 128-, 64- и 32-разрядными операндами: 


поуарз — пересылка выровненных по 16-байтовой границе 128-разрядных 
операндов. В качестве входного операнда могут выступать ХММ-регистр 
или 128-разрядная ячейка памяти, выходным операндом может служить 
один из ХММ-регистров. Если адрес ячейки памяти не будет выровнен по 
16-байтовой границе, то произойдет исключение общей защиты. 


тоуур$ — пересылка невыровненных данных; в качестве входного операнда 
могут выступать ХММ-регистр или 128-разрядная ячейка памяти, выход- 
ным операндом может служить один из ХММ-регистров. Команда не тре- 
бует выравнивания по 16-байтовой границе. 


тоуйрз — пересылка невыровненных 64 бит из входного операнда в выход- 
ной. Один из операндов обязательно должен быть ХММ-регистром, в каче- 
стве второго может выступать 64-разрядная ячейка памяти. Пересылаются 
только старшие 64 бит входных операндов. Младшие 64 бит обоих операн- 
дов не изменяются. Если данные передаются из ХММ-регистра, то пересыл- 
ке подлежат только старшие 64 бит. Команда не требует выравнивания по 
16-байтовой границе адреса ячейки памяти. Схема выполнения команды 
тоуйрз показана на рис. 13.6. 
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то\уйр$ ХММО, тет1 


тет1 (операнд в памяти) 





Рис. 13.6. Схема работы команды то\Прх 


» ПОУИТрз — пересылка невыровненных 64 бит из входного операнда в выход- 
ной. Оба операнда должны находиться в ХММ-регистрах. Пересылаются 
только старшие 64 бит входных операндов. В результате выполнения этой 
команды изменяются младшие 64 бит регистра-приемника. Схема выпол- 
нения команды поуЙ1р$ показана на рис. 13.7. 


моурз ХММО, ХММ1 


хмм1 хммо 
127 63 0 127_ _63 0 





3 0 


Рис. 13.7. Схема работы команды по\ря 


® ПОУ1Ирз — пересылка невыровненных 64 бит из входного операнда в выходл- 
ной. Оба операнда должны находиться в ХММ-регистрах. Пересылаются 
только младшие 64 бит входных операндов. В результате выполнения этой 
команды изменяются старшие 64 бит регистра-приемника. Схема выполне- 
ния команды поу1Ир$ показана на рис. 13.8. 


мо\йрз ХММО, ХММ1 
ХММ1 хммо 





хммо 


Рис. 13.8. Схема работы команды то\мрз 


» по\У1рз — пересылка невыровненных 64 бит из входного операнда в выходной. 
Один из операндов обязательно должен быть ХММ-регистром, в качестве 
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второго может выступать 64-разрядная ячейка памяти. Пересылаются толь- 
ко младшие 64 бит входных операндов. Старшие 64 бит обоих операндов 
не изменяются. Если данные передаются из ХММ-регистра, то пересылке 
подлежат только младшие 64 бит. Команда не требует выравнивания по 
16-байтовой границе адреса ячейки памяти. Схема выполнения команды 
тоу1рз показана на рис. 13.9. 


то\Мрз$ ХММО, тет1 


пет] (операнд в памяти) 
63 0 





127 63 0 
хммМо 





Рис. 13.9. Схема работы команды то\Мрз 


поут$Крз — пересылка знакового бита каждого из четырех упакованных чи- 
сел входного операнда в младшие четыре бита выходного операнда. В каче- 
стве входного операнда может выступать только ХММ-регистр, а в качест- 
ве выходного операнда — 32-разрядный регистр общего назначения. Эта 
команда используется для организации условных переходов. Схема выпол- 
нения команды тоутзКрз показана на рис. 13.10. 


тоутзКрз к3З2, ХММО 


знаковые биты 





31 16 15 76543210 
Рис. 13.10. Схема работы команды томтзКре 


тоу5$ — пересылка 32 младших битов из источника в приемник, при этом 
как минимум один из операндов должен быть ХММ-регистром. Второй 
операнд должен быть 32-разрядной ячейкой памяти. При выполнении 
операции пересылки из операнда в памяти младшие 32 бит помещаются 
в младшие 32 бит ХММ-регистра. Если выполняется пересылка из ХММ- 
регистра, то выбираются младшие 32 разряда регистра, остальные разряды 
не изменяются. 
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После описания команд пересылки данных рассмотрим несколько примеров 
их практического применения, но перед этим сделаю одно важное замечание — 
в исходном тексте ассемблерных программ, содержащих $ЗЕ-команды, обязатель- 
но должна присутствовать директива .ХММ. В первом примере демонстрируется 
работа команд поуй1рз и поу1Ир5. Программный код представлен двумя процедура- 
ми: поуй1рз_ех и _моу1Ирз_ех (листинг 13.2). 


Листинг 13.2. Применение команд передачи данных 


.686 

.моде} #1а& 

„ХММ 

орЁТоп сазетар: попе 
„дата 


гез 00 

.соде 

_мюУи1рз_ех ргос 
моуир$ ХММО. а1 
моуир$ ХММ1. Ь1 
тоуй1р$ ХММО, ХММ 
тоуир$ гез. ХММ0 
Теа ЕАХ. гез 
ге 

_пюуй1рз_ех епар 

_мю\1ирз_ех ргос 
тоуир$ ХММО. а1 
тоуир$ ХММ1. Ь1 
моу1Ир$ ХММО. ХММ1 
поуир$ гез. ХММо 
Леа ЕАХ, гез 
ге 

_моу1ирз_ех епдр 

епд 


В первой процедуре, _моу1рз_ех, в ХММ-регистры ХММО и ХММ1 помещаются 
элементы массивов а] и Ь] соответственно. Это выполняется при помощи команд 


мочир$ ХММО, а1 
моуир$ ХММ1. 61 


После этих операций ХММ и ХММ1 будут содержать элементы массивов в таком 
порядке, как показано на рис. 13.11. 


127 96 95 64 63 32 31 0 
Дер | о [м 
127 96 95 64 63 32 31 0 


ОЕ ОИСИ ПООЕИ ПООСИИ Жо 


Рис. 13.11. Содержимое регистров после выполнения команд то\ирв 
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После выполнения следующей команды регистр ХММО будет содержать значе- 
ния двойных слов, показанные на рис. 13.12: 


пюуН1р$ ХММО. ХММ1 
127 96 95 64 63 32 31 0 


Рис. 13.12. Содержимое регистров после выполнения команды то\!рз 


И наконец, команда 
ПЮУир$ гез. ХММО 


После выполнения этой команды переменная гез будет содержать последова- 
тельность данных, показанную на рис. 13.13. 


Младший адрес Старший адрес 


[в | 


Рис. 13.13. Содержимое массива гез после выполнения команды тоуир$ 


Думаю, что читатель сможет самостоятельно проанализировать программный 
код процедуры _моу1прз_ех. 

Для тестирования только что рассмотренных ассемблерных процедур мож- 
но воспользоваться программным кодом приложения на У1зиа| С++ МЕТ (ли- 
стинг 13.3). 


Листинг 13.3. Демонстрационная программа для процедур из листинга 13.2 
ЯНисТиде <$%910.1> 

ехёегп "С" 1п%* поуП1рз_ех(\ота): 

ехёегп "С" 1пё* моу1Ир$_ех(у019): 

11 ма1п(\у019) 


{ 

рг1иЕ{( "МОУНЫР$ ехатр1е:\п”); 
116* р11 = моуй1рз_ех(); 

Тог (1 11 = 0:11 <4: 11++) 


{ 
риг1ие+( "$4 ". *р11++): 


} 

рг1пЕ+("\иМОМЕНР$ ехатр!е:\п"); 
116% р12 = моу1Прз_ех(): 

Тог (116 11 = 0:11 <4; 11++) 


{ 
риТиЕТ( "84 ". *р12++): 
} 


геёигп 0: 


} 


Результат, выведенный на экран: 


МОУНЕР$ ехатр1е: 
5746 
МОМ.НР$ ехатр1е: 
0213 
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Команда тоутзКрз, как было отмечено, сохраняет в 32-разрядном регистре 
знаковые биты 4 упакованных чисел из ХММ-регистра. Пример демонстраци- 
онной процедуры, анализирующей эти биты (она называется _тоутзКрз_ех), при- 
веден в листинге 13.4. В зависимости от значения знакового бита процедура 
возвращает в регистре ЕАХ адрес строки, содержащей соответствующее сообщение 
о знаке числа. Программный код процедуры обрабатывает одновременно 4 числа 
из массива. 

Процедура принимает три параметра (слева направо): 


® адрес массива чисел с плавающей точкой; 

» смещение в массиве — неотрицательное целое число; 
® смещение элемента в группе (0-3). 

Мнемонически процедуру можно представить так: 
_моут$Крз_ех(адрес_массива. смещение в_массиве. смещение элемента) 


Листинг 13.4. Применение команды томтзКр$ 


.686 

„моде? Ра* 

„ХММ 

ор1оп сазетар: попе 
.дафа 


роз питрег ОВ "Митрег 1$ ро$1%1уе!". 0 
пед_питбег ОВ “Митбег 1$ педай1уе!". 0 
.с0де 
_тоутКкрз_ех ргос  ризп ЕВР 

му ЕВР. ЕЗР 

оу ЕЗГ. Чмог@ рёг [ЕВР+8] 

тоу ЕОХ. нога рег [ЕВР+12] 

$11 ЕОХ. 2 

294 ЕЗТ. ЕБХ 

оу ЕСХ. Чног@ рёг [ЕВР+16] 


помирз ХММ. [ЕЗП] 
моут$Ккр$ ЕВХ. ХММО 


ы ЕВХ. ЕСХ 
дс пед_гез 
Теа ЕАХ. ро$_питбег 
Эр ех1( 
пед_гез: 
Теа ЕАХ. пед питбег 
ех1 т: 
рор ЕВР 
ге 
_томт$Крз_ех епар 
епд 


Проведем краткий анализ исходного текста. Адрес массива помещается в ре- 
гистр Е5! командой 


моу ЕЗГ. дога рёг [ЕВР+8] 


Смещение группы из 4 элементов, требующих обработки, относительно нача- 
ла массива вычисляется при помощи команд 


моу ЕОХ. Фмогд рег [ЕВР+12] 
$81 Е0БХ. 2 
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Найденное смещение помещается в регистр ЕСХ. Обратите внимание на то;что 
смещение пересчитывается в двойные слова, поскольку мы имеем дело с 32-раз- 
рядными числами. Затем устанавливаем указатель адреса на первый элемент 
группы, выполнив команду 


а49 ЕЗТ. ЕОХ 

Теперь нужно получить смещение элемента массива в группе. Для этого поме- 
щаем значение третьего параметра в регистр ЕСХ: 

тоу ЕСХ. Омогд рег [ЕВР+16] 

Следующие две команды загружают в регистр ХММО четыре двойных слова по 
смещению, указанному в регистре Е5Т, и помещают знаковые биты в регистр ЕВХ: 


тоуир$ ХММО. [Е5Г] 

тоут$Кр$ ЕВХ. ХММО 

Для лучшего понимания выполняемой операции представим, что есть массив 
вещественных чисел, например: 


3,45, —6, -9,4, 2, 99, 34, 45, —1,22, 49, —25, —3,09 


Предположим, нас интересуют знаки 5-го и 7-го элементов (это числа 34 и -1,22, 
нумерация начинается с нуля). Для определения знаков элементов можно вы- 
звать процедуру с разными параметрами: 


® для 5-го элемента: 


_тоутзкрз_ех(адрес_массива. 4. 1) 


® для 7-ГО элемента: 
_моут$Крз_ех(адрес_ массива. 4. 3) 


Вернемся к нашей программе. К этому моменту в битах 0-3 регистра ЕВХ нахо- 
дятся знаковые биты 4 упакованных чисел из ХММ0. Для того чтобы определить 
знак требуемого элемента, воспользуемся командой 


БЕ ЕВХ. ЕСХ 


Эта команда помещает значение бита, указанного в регистре ЕСХ, во флаг пере- 
носа СЕ. 

Далее содержимое флага переноса анализируется командой )с и, в зависимо- 
сти от результата, в регистр ЕАХ помещается адрес строки с сответствующим сооб- 
щением, после чего происходит выход из процедуры. 

Перейдем к следующей группе команд, которая включает в себя арифметиче- 
ские команды сложения, вычитания, умножения и деления. 


13.2. Арифметические команды 


Группа арифметических команд включает команды сложения и вычитания, умно- 
жения и деления, также к ним часто относят и команды извлечения квадратного 
корня и вычисления максимального/минимального значения. Приступим к более 
детальному анализу арифметических команд и начнем с команд сложения: 
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® а94р5 — параллельное сложение 128-разрядных операндов, при этом в каче- 
стве входного операнда (операнда-источника) выступают один из ХММ-ре- 
гистров или 128-разрядная ячейка памяти. Выходным операндом команды 
(операндом-приемником) является один из ХММ-регистров; 


® а0455 — скалярное сложение операндов; младшие двойные слова операндов 
должны быть числами с плавающей точкой в коротком формате (зте 
ргесз1оп). Результат помещается в операнд-приемник, в качестве которого 
может выступать ХММ-регистр. Входным операндом может быть ХММ- 
регистр или 32-разрядная ячейка памяти. 


Следующий пример, реализованный в виде процедуры _а@4р$_ех, демонстри- 
рует применение команды а44р$ (листинг 13.5). 


Листинг 13.5. Параллельное сложение 128-разрядных операндов 


686 
„тюфе Ра 
„ХММ 
ор1оп сазетар:попе 
.дафа 
а1 00 34.78, -56.07, -129.31, 94.2 
Ы 00 -59.16. 44.93. -73.12. 19.61 
Теп ЕСИ $-61 
ге 00 Тем 0\Р(0) 
.соде 
_ад9рз_ех ргос 
Теа ЕЗТ. а1 
Теа ЕОГ. Б1 
момир$ ХММ0. [Е$Г] 
ад9р$ ХММО. [Е0Т] 
моуир$ гез. ХММо 
Теа ЕАХ. ге 
ге 
_ааарз_ех епар 
епд 


Сложение двух массивов, а1 и 51, можно выполнить и с помощью команды 
скалярного сложения а445$, работающей с 32-разрядными операндами. Эта опе- 
рация реализована в листинге 13.6 с помощью процедуры _а945$_ех. 


Листинг 13.6. Скалярное сложение элементов массивов 


.686 
‚моде +]а{ 
.ХММ 
орЕ1оп сазетар:попе 
‚Чата 
а1 00 34.78. -56.07. -129.31. 94.2 
Ы 00 -59.16, 44.93. -73.12. 19.61 
Теп ЕСИ $-51 
гез 00 1еп 0Р(0) 
.соде 
_а99$$_ех ргос 
1еа ЕЗТ, а1 
]еа ЕОГ. Ы1 


1еа — ЕВХ. гез | продолжение „7 
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Листинг 13.6 (продолжение) 


МОУ 
$АР 
пех: 
МОУ( 
29955 
ее) 
а9д 
299 
а9д 
дес 
2 
]еа 
ге 


_ 2945$ 


епа 


ЕСХ. 1еп 
ЕСХ. 2 


ХММО. бог рег [Е$1] 
ХММО. @могд рёг [Е0Г] 
ЧФиогд руг [ЕВХ], ХММО 
ЕЗГ, 4 

ЕОТ, 4 

ЕВХ. 4 

ЕСХ 

пех 

ЕАХ. гез 


ех епдр 


Сложение элементов массивов выполняется в цикле пех: 


пехё: 
поу@  ХММО. бмогд рёг [ЕЗГ] 
2445$ ХММО. @могд рёг [ЕСГ] 
ЮУ мог рёг [ЕВХ]. ХММО 


иг пехё 


В каждой итерации цикла складываются два 32-разрядных операнда. Для это- 
го служит команда 


а495$ ХММО. Чмогд рёг [ЕОТ} 


К командам вычитания относятся следующие инструкции ассемблера: 


зибрз — параллельное вычитание 128-разрядных операндов; в качестве опе- 
ранда-источника выступают один из ХММ-регистров или 128-разрядная ячей- 
ка памяти. Выходным операндом команды является один из ХММ-регистров; 


$4655 — скалярное вычитание операндов; младшие двойные слова опе- 
рандов должны быть числами с плавающей точкой в коротком формате. 
Результат помещается в операнд-приемник, в качестве которого может 
выступать ХММ-регистр. Входным операндом могут быть ХММ-регистр 
или 32-разрядная ячейка памяти, 


В листинге 13.7 показано использование команды $и6р$ для попарного вычи- 


тания 


элементов массивов 81 и Б1 (процедура _зи6рз_ех). 


Листинг 13.7. Параллельное вычитание 128-разрядных операндов 


.686 
„тюбе] Рае 
„ХММ 
ор1оп сазетар: попе 
„Дафа 
а1 00 34.78, -56.07. -129.31. 94.2 
Ь1 00 -59.16, 44.93. -73.12. 19.61 
1еп ЕСУ $-51 
гез 00 Теп 0УР(0) 


.соде 
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_$и6рз_ех ргос 
1еа ЕЗГ, а1 
Леа ЕОТ. 61 
поуир$ ХММО. [Е$Т] 
зибрз$ ХММ0. [ЕОТ] 
поуир$ гез. ХММО 
]еа ЕАХ. гез 
ге 

_$и6рз_ех епар 

епЧ 


Исходный текст процедуры _зи6рз_ех во многом напоминает программный 
код ранее рассмотренной процедуры для параллельного сложения _а@арз_ех, за 
исключением того, что здесь используется команда $и5р$ вместо адар$, поэтому 
останавливаться подробно на этом коде нет смысла. 

Для ознакомления с работой команды скалярного вычитания $655 можно 
воспользоваться исходным текстом процедуры _а995$_ех, заменив в ней команду 
а445$ командой $16$$. 

Теперь проанализируем работу команд параллельного и скалярного умножения: 


® пир — параллельное умножение 128-разрядных операндов; в качестве 
операнда-источника выступают один из ХММ-регистров или 128-разряд- 
ная ячейка памяти. Выходным операндом команды должен быть один из 
ХММ-регистров; 


® пи155$ — скалярное умножение операндов; младшие двойные слова операн- 
дов должны быть числами с плавающей точкой в коротком формате. Ре- 
зультат помещается в операнд-приемник, которым должен быть ХММ-ре- 
гистр. Входным операндом могут быть ХММ-регистр или 32-разрядная 
ячейка памяти. 


Листинг 13.8 демонстрирует применение команды ти1рз, реализованной в ви- 
де процедуры _пи/1рз_ех. 


Листинг 13.8. Параллельное умножение 128-разрядных операндов 


.686 
„люде] РТа+ 
„ХММ 
орЕТоп сазетар: попе 
„Чата 
а1 00 34.78, -56.07. -129.31, 94.2 
Ь1 00 -59.16. 44.93, -73.12. 19.61 
Теп ЕЦЦ $-51 
гез 00 1еп 0\Р(0) 
.соде 
_му7р$_ех ргос 
Теа ЕЗГ. а1 
Теа ЕОТ, 61 
тоуир$ ХММО. [Е$Г] 
ти1р$ ХММО. [ЕОГ] 
поуир$ гез. ХММо 
Теа ЕАХ. гез 
ге 
т рз_ех епар 
ета 





332 Глава 13 » $5Е-расширение процессоров Тпе! РепНит 


Алгоритм выполнения процедуры резлизован так же, как и для команд парал- 
лельного сложения и вычитания, поэтому останавливаться на нем я не буду. Про- 
верить работоспособность процедуры _пи1рз_ех можно с помощью простой про- 
граммы на У!5иа] С++ .МЕТ (листинг 13.9). 


Листинг 13.9. Демонстрационная программа для процедуры из листинга 13.8 


ТисТиде <5Е410.1> 
ехбегп "С" ТТоаф* ти1рз_ех(\014): 
11 та1п(\о1а) 


ргТиЕГ( "МАР ехатр1е:\п”); 
Поас* рти1р$ = ти1рз_ех(); 
Фог (11 11 =0; 11 < 4;11++) 


{ 
рг1пё+("%5.2Р ", *рти1р$++); 
} 


гефигп 0; 


} 


Напомню, что вызываемая процедура должна быть объявлена с директивой 
ех{егп, а возвращаемое значение указывает на адрес массива чисел с плавающей 
точкой (110а1*) в коротком (32 бита) формате. 

Для проверки функционирования команды скалярного умножения можно 
воспользоваться исходным текстом одной из ранее рассмотренных процедур для 
скалярного сложения (_а44$$_ех) или скалярного вычитания (_5и65$_ех), заменив 
в них команду а94$$ или $555 командой ти15$. 

Следующая группа команд, работу которых мы проанализируем, — команды 
параллельного и скалярного деления: 


® (1ур5 — параллельное деление 128-разрядных операндов; в качестве опе- 
ранда-источника выступают один из ХММ-регистров или 128-разрядная 
ячейка памяти. Выходным операндом команды должен быть один из ХММ- 
регистров, при этом в качестве делимого выступает операнд-приемник, а в ка- 
честве делителя — операнд-источник. Результат помещается в операнд- 
приемник; 


® 01/55 — скалярное деление операндов; младшие двойные слова операндов 
должны быть числами с плавающей точкой в коротком формате. Результат 
помещается в операнд-приемник, в качестве которого должен выступать 
ХММ-регистр. Входным операндом могут быть ХММ-регистр или 32-раз- 
рядная ячейка памяти. 


В листинге 13.10 показан программный код, демонстрирующий использова- 
ние команды @1\р5 и реализованный в виде процедуры _@1урз_ех. 


Листинг 13.10. Параллельное деление 128-разрядных операндов 


.686 

.тоде1 Гаф 

„ХММ 

орЕ1оп сазетар: попе 

„Чата 

а1 00 34.78. -56.07. -129.31, 94.2 
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Ы 00 -59.16, 44.93, -73.12. 19.61 
1Теп Е(У $-51 
гез 00 Теп 0\Р(0) 


.соде 


_Ч1урз_ех ргос 


Теа 
Теа 


ЕЗГ. а1 
ЕОТ, 61 


тмомирз ХММО. [Е$1] 
Ч1ур$ ХММО. [ЕО0Г] 
тоуир$ гез, ХММО 


]еа 
ге 


ЕАХ. гез 


_@1урз_ех епар 


еп4 


К группе арифметических команд, помимо тех, что выполняют четыре основ- 
ных действия, обычно относят команды извлечения квадратного корня, опреде- 
ления максимального/минимального значения и нахождения значения, обратно- 
го исходной величине. Перечислим эти команды по порядку: 


$4гёр$ — параллельное извлечение квадратного корня из упакованных чи- 
сел с плавающей точкой. Команда имеет два операнда: источник и прием- 
ник. В качестве операнда-источника могут выступать ХММ-регистр или 
128-разрядная ячейка памяти, в качестве приемника — ХММ-регистр; 


$4гё5$ — скалярное извлечение квадратного корня из упакованного чис- 
ла с плавающей точкой. В качестве операнда-источника могут выступать 
32-разрядная ячейка памяти или ХММ-регистр. В том случае, если источ- 
ником является ХММ-регистр, используется младший 32-разрядный опе- 
ранд, при этом остальные операнды не изменяются. В качестве операн- 
да-приемника должен выступать ХММ-регистр; 


махр$ — параллельное получение максимального значения для каждой па- 
ры упакованных чисел с плавающей точкой. Команда имеет два операнда: 
источник и приемник. В качестве операнда-источника могут выступать 
ХММ-регистр или 128-разрядная ячейка памяти, в качестве приемника — 
ХММ-регистр, в который помещаются максимальные элементы каждой пары. 
Содержимое операнда-источника после выполнения операции не изменяется; 


пиирз — параллельное получение минимального значения для каждой пары 
упакованных чисел с плавающей точкой. Команда имеет два операнда: 
источник и приемник. В качестве операнда-источника могут выступать 
ХММ-регистр или 128-разрядная ячейка памяти, в качестве приемника — 
ХММ-регистр, в который помещаются максимальные элементы каждой пары. 
Содержимое операнда-источника после выполнения операции не изменяется; 


тах$$ — скалярное получение максимального значения для младшей пары 
упакованных 32-разрядных операндов приемника и источника. Результат 
помещается в операнд-приемник, в качестве которого может выступать один 
из ХММ-регистров, при этом его младший операнд замещается максималь- 
ным значением. В качестве операнда-источника может выступать 32-разряд- 
ное значение в памяти либо младший операнд ХММ-регистра. После вы- 
полнения операции содержимое операнда-источника остается неизменным; 
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® 11155 — скалярное получение минимального значения для младшей пары 
упакованных 32-разрядных операндов приемника и источника. Результат 
помещается в операнд-приемник, в качестве которого может выступать 
один из ХММ-регистров, при этом его младший операнд замещается ми- 
нимальным значением. В качестве операнда-источника может выступать 
32-разрядное значение в памяти либо младший операнд ХММ-регистра. 
После выполнения операции содержимое операнда-источника остается 
неизменным. 


Приведу несколько примеров применения этих команд. Например, извлече- 
ние квадратного корня из каждого элемента массива чисел с плавающей точкой 
можно осуществить при помощи демонстрационной процедуры _5$4г®_ех, исход- 
ный текст которой представлен в листинге 13.11. 


Листинг 13.11. Извлечение квадратного корня из элементов массива 


.686 
.пю4е] Е]ае 
„ХММ 
орётоп сазетар: попе 
.Чаа 
ве5_00 32 ШР (0) 
.соде 
_ 5аге-ех ргос 
ризй  ЕВР 


оу ЕВР. ЕЗР 
оу ЕАХ. Чмюг@ рег ГЕВЗР+12] 


эйг ЕАХ. 2 
ОУ ЕВХ. 4 
хог ЕОХ. ЕОХ 
Оу ЕВХ 

ШОУ ЕСХ. ЕАХ 


ру Е$Г. @мюга рёг [Е3Р+8] 
феа ЕОТ, гез 
тех: 
загёрз ХММО, [ЕЗГ] 
шоуир$ [Е0Г]. ХММО 


а99 ЕЗГ, 16 

а99 ЕОТ. 16 

9ес ЕСХ 

па пехё 

стр ЕБХ, 0 

де ех1{ 

ОУ ЕСХ. ЕОХ 
пехе1: 


$4гё$$ ХММ0. [ЕЗГ] 
05$ [40]. ХММО 


а19 Е5Т, 4 

ада ЕОТ, 4 

дес ЕСХ 

д? вех 
ахти; 


фра ЕАХ. гез 
рор ЕВР 
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ге 
_$аг ех епар 
епа 
Процедура _54г®_ех в качестве параметров принимает адрес массива чисел с пла- 
вающей точкой и размер массива в байтах. Мнемонически объявление процеду- 
ры можно представить так: 


_$аг_ех(адрес_массива. размер) 


Процедура возвращает в регистре ЕАХ адрес массива гез двойных слов, содер- 
жащих значения квадратного корня. 

Параметры извлекаются из стека с использованием регистра ЕВР. Размер ис- 
ходного массива в общем случае не кратен 16 байт, поэтому часть элементов мож- 
но обработать с помощью параллельной команды $4гёрз, а часть — с помощью 
скалярной команды 54/455. Например, если исходный массив содержит 7 двойных 
слов (представление коротких чисел с плавающей точкой), то с помощью коман- 
ды $9гёрз можно обработать 4 двойных слова (16 байт), а оставшиеся 3 двойных 
слова — командой $0г{5$. 

Следующие команды позволяют выделить количество групп элементов по 
4 двойных слова, а также число оставшихся элементов: 


оу ЕАХ. Фюга рёг [ЕВР+12] ; размер исходного 
: массива (в байтах) -> ЕАХ 


иг ЕАХ. 2 ; преобразовать в количество двойных слов 
моу ЕВХ, 4 

хог ЕОХ. ЕОбХ 

Чу ЕВХ : ЕАХ = количеству 128-разрядных операндов 


;: Е0Х = количество оставшихся 
; 32-разрядных операндов 
Далее, команда тоу ЕСХ, ЕАХ заполняет в регистр-счетчик цикла для обработки 
128-разрядных операндов, а следующие команды загружают в регистры ЕЗГ и ЕВ] 
адреса исходного и результирующего массивов соответственно: 


тоу ЕЗТ. @мога рёг [ЕВР+8] 
Теа ЕОГ, гез 


Затем начинается обработка 128-разрядных элементов в цикле пех{: 


пех: 
$агЕрз$ ХММО. [ЕЗТ] 
тоуир$ [ЕБГ], ХММО 


312 пехё 

Здесь команда 549г&р$ формирует результат в регистре ХММО, после чего 4 двой- 
ных слова записываются из ХММ в 4 двойных слова массива гез, указатель которо- 
го находится в регистре Е01. После этого выполняется переход на следующие ад- 
реса в исходном и результирующем массивах и цикл повторяется. 

По окончании цикла пех проверяется, есть ли еще 32-разрядные элементы: 

стр Е0Х. 0 

3е ех 

тоу ЕСХ. ЕБХ 


336 Глава 13 ‹ 55Е-расширение процессоров те! Репбит 


Если есть (содержимое ЕбХ отлично от нуля), то переходим к выполнению 
цикла пех{1, в котором квадратный корень вычисляется для 32-разрядных эле- 
ментов при помощи скалярной команды $4г15$: 

пех]: 


$49гё5$ ХММО. [Е$1) 
тоу5$ [Е0Г]. ХММо 


372 пехё1 


Обратите внимание на то, что пересылка результирующего значения из реги- 
стра ХММ0 осуществляется командой скалярной пересылки данных: 


тоу5$ [Е0Г], ХММо 


Предпоследняя команда помещает в регистр ЕАХ адрес массива гез, в котором 
находятся вычисленные значения: 


1еа ЕАХ. гез 


После этого происходит выход из процедуры. Замечу, что процедура может 
обрабатывать массивы очень большого размера (определяется размерностью ре- 
гистра ЕСХ). 

Для тестирования процедуры _$4г_ех используется программа на \У1зиа] 
С++ МЕТ (листинг 13.12), 


Листинг 13.12. Демонстрационная программа для процедуры из листинга 13.11 


ИпсТиде < 410.1> 
ехбёегп "С" ТТоаф* $4г*_ех(Тоа%* а1, 17 а$12е): 
196 ма1п(\01а) 


{ 

_ дес15рес(а119п(16)) Тоаф а1[7]= { 44.21, 18.74, 234.65. 82.51, 5249,09, 1.55, 138.02}; 
116 а$126е = $12601(а1): 

РТоаф* рь1 = $агё_ех(а1, а$12е):; 

рг1пЕт( "ЗОВТР$-50ВТ$$ ехатр1е:\п"): 

Фог (11 11 =0;11 < а$12е / 4: 11++) 


{ 
р” пе ("45.24 ". *рБ1++); 


гебигт 0: 
} 

Здесь я хочу отметить один важный момент: некоторые команды 5$3Е-расши- 
рения требуют выравнивания данных по 16-байтовой границе (это повышает 
быстродействие), в противном случае генерируется исключение общей защиты 
(Сепега! Рго{есНоп Рац, СРЕ). Такое выравнивание в С++ можно выполнить, 
указав в объявлении массива ключевые слова 


__дес15рес(а149п 16)) 


Можно обойтись и без выравнивания данных в вызывающей программе, осо- 
бенно если непонятно, как это сделать. В этом случае вызывающая программа мо- 
жет работать с обычными данными, но при этом следует изменить программный 
код цикла пех самой процедуры _54г+_ех (показана жирным шрифтом): 
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пех: 
тоуирз ХММО, [Е$ЗГ] 
$агёрз ХММО, ХММо 
томир$ ГЕОТ], ХММо 


ада ЕЗГ. 16 
а94 ЕОГ. 16 
дес ЕСХ 

302 пех 


Здесь невыровненные входные данные, находящиеся по адресу в регистре ЕЗТ, 
пересылаются в регистр ХММО при помощи команды 


тмоуирз ХММО. [ЕЗГ] 


Затем в следующей команде, $4г%рз, в качестве входного и выходного операн- 
дов просто указываем один и тот же регистр (ХММ0). В этом случае исключения об- 
щей защиты не возникает. 

Вызывающая программа в процессе выполнения выводит на экран такие ре- 
зультаты: 

ЗОКТР$-50ВТ$$ ехатр!е: 

6.65 4.33 15.32 9.08 72.45 1.24 11.75 

Для демонстрации работы команды поиска максимальных значений из пар 
элементов разработаем процедуру _пах_ех, в которой будем использовать как 
команду для параллельной обработки (тахрз), так и скалярную команду (пмахз5). 
В качестве параметров процедура принимает адреса двух массивов и их размер 
(предполагается, что размеры массивов одинаковы), а возвращает адрес мас- 
сива, содержащего максимальные элементы. Мнемонически процедуру можно 
представить так; 


_тах_ех(адрес_массива1, адрес_массива?. размер) 
Исходный текст процедуры приведен в листинге 13.13. 


Листинг 13.13. Поиск максимальных элементов в двух массивах 


.686 
„тоде] Гат 
.ХММ 
орЁТоп сазетар: попе 
„дафа 
гез 00 32 [Р (0) 
.соде 
_мах_ех ргос 
ризп  ЕВР 
оу ЕВР, ЕЗР 
тоу  ЕАХ, @июга рёг [ЕВР+16] 
$"  ЕАХ, 2 
ту  ЕВХ, 4 
хог  ЕОХ. ЕБХ 
Ч1у ЕВХ 
ту — ЕСХ. ЕАХ 


тмоу ЕТ. @нога рёг [ЕВР+8] 
тоу  ЕОГ. дога рег [ЕВР+12] 


1еа — ЕВХ. гез продолжение 7 
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Листинг 13.13 (продолжение) 


пеж: 
моуир$ ХММО. [Е5Г] 
тоуир$ ХММ1. [Е013 
тахрз ХММО. ХММ1 
тоуир$ [ЕВХ]. ХММО 


а99 ЕТ. 16 
аа9 ЕОТ. 16 
аа9 ЕВХ. 16 
дес ЕСХ 

К] пех+ 

стр ЕОХ. 0 
3е ех14 

оу ЕСХ, ЕОХ 

пехф1: 


поу5$ ХММО. [Е$Г] 
тоу$$ ХММ1. [ЕОТ] 
тах$$  ХММО. ХММ1 

то\у5$$ [ЕВХ]. ХММо 


а99 ЕЗТ, 4 
а99 ЕОГ. 4 
ада ЕВХ. 4 
дес ЕСХ 
372 пех 1 
ех1{: 
1еа ЕАХ. гез 
рор ЕВР 
ге 
_тах_ех епЧр 
епа 


Большая часть программного кода процедуры нам знакома из предыдущих 
примеров, поэтому остановлюсь на ключевых аспектах. 

Процедура принимает три параметра с использованием регистра ЕВР: адрес пер- 
вого массива вещественных чисел ([ЕВР+8]), адрес второго массива ([ЕВР+12]) и раз- 
мер массивов в байтах ([ЕВР+16]). Кроме того, предполагается, что размер обоих 
массивов одинаков. Адреса этих массивов вместе с адресом массива гез, куда 
будет помещен результат, загружаются в регистры Е$1, ЕОТ и ЕВХ соответственно: 

тоу Е5Г, мог рёг [ЕВР+8] 


пои ЕОГ. дога рёг [ЕВР+12] 
Леа ЕВХ, гез 


Собственно вычисления выполняются, как и в предыдущих примерах, в двух 
циклах: пех и пех{1. В цикле пех* происходят параллельные операции по опреде- 
лению максимального значения в 32-разрядных парах 128-разрядных элементов: 


пехё: 
туирз ХММО, [ЕЗТ) 
По\ир$ ХММ1. [Е0Т] 
махр$ ХММО. ХММ1 
тоуирз [ЕВХ]. ХММо 


372 пехё 
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Здесь 128-разрядные операнды загружаются в регистры ХММ и ХММ1, после чего 
вычисляются максимальные значения командой 


тахр$ ХММО, ХММ1 


В цикле пех{1 обрабатываются одиночные 32-разрядные элементы массивов 
с использованием скалярной команды пах$5: 
пехё1: 
поу5$ ХММО. [51] 
тоуз$ ХММ1. [ЕОГ] 


тах$$ ХММО, ХММ 
поу5$ [ЕВХ). ХММО 


372 | пехё1 


По окончании вычислений адрес массива гез, где находятся результаты вы- 
числений, помещается в регистр ЕАХ, после чего происходит выход из процедуры. 
Используя программный код процедуры _пах_ех, легко создать процедуру для 
вычисления минимальных значений в парах элементов массивов. Для этого до- 
статочно заменить команды вычисления максимума соответствующими команда- 
ми вычисления минимума (тахр5 заменить на п1прз, а мах5$ — на 1155). 
Последняя группа команд, которые относятся к арифметическим и которые 
мы сейчас рассмотрим, — это команды вычисления обратных значений. Как и боль- 
шинство $$Е-команд, они оперируют либо четырьмя упакованными 32-разряд- 
ными значениями (параллельные), либо младшими 32-разрядными операндами 
(скалярные). Команды вычисления обратных значений обеспечивают точность 
не менее 11 бит. Это означает, что максимальное значение относительной по- 
грешности будет менее чем 1,5 х 2-2. Для лучшего понимания можно выразить 
значение относительной погрешности формулой 
| точное значение — приблизительное значение | 


<15х2-п 
приблизительное значение 


К командам этой подгруппы относятся: 


® гсррз — параллельное вычисление обратных значений упакованных опе- 
рандов. Если Х — значение одного из 32-разрядных операндов, то вычисля- 
ется 1/Х. В качестве входного операнда могут выступать ХММ-регистр 
или 128-разрядная ячейка памяти, а выходным операндом должен быть 
ХММ-регистр; 


® гсрз5 — скалярное вычисление обратного значения младшего 32-разрядно- 
го операнда. В качестве входного операнда могут выступать ХММ-ре- 
гистр или 32-разрядная ячейка памяти, а выходным операндом должен быть 
ХММ-регистр. Операция не затрагивает содержимого старших операндов 
ХММ-регистра; 

® г5дгрз — параллельное вычисление обратных значений квадратного корня 
упакованных операндов. Если Х — значение одного из 32-разрядных опе- 
рандов, то вычисляется 1/^/Х.. В качестве входного операнда могут высту- 
пать ХММ-регистр или 128-разрядная ячейка памяти, а выходным операн- 
дом должен быть ХММ-регистр; 
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® 1г54Г{5$ — скалярное вычисление обратного значения квадратного корня 
младшего 32-разрядного операнда. В качестве входного операнда могут вы- 
ступать ХММ-регистр или 32-разрядная ячейка памяти, а выходным опе- 
рандом должен быть ХММ-регистр. Операция не затрагивает содержимого 
старших операндов ХММ-регистра. 


Рассмотрим несколько примеров работы команд, вычисляющих обратные значе- 
ния. Первый пример демонстрирует применение команд гсррз и гср$$ и реализо- 
ван в виде процедуры _гср_ех. Процедура в качестве параметров принимает адрес 
массива чисел с плавающей точкой и размер массива (параметры извлекаются 
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при помощи регистра ЕВР). 


Хочу обратить внимание на то, что данные массива желательно выровнять по 
16-байтовой границе. Процедура возвращает в регистре ЕАХ адрес массива, в кото- 
рый помещаются вычисленные обратные значения. Исходный текст процедуры 
_гср_ех показан в листинге 13.14. | 


Листинг 13.14. Вычисление обратных значений чисел 


.686 
„тоде1 Ча 
‚ХММ 


“орЕ1оп хазетар: попе 


‚дата 
825 00 32 УР (0) 


.соде 
„„гер_ех реос 
ризи ЕВР 
МОУ ЕВР, ЕЗР 
[И БАХ, длога-отг [Е3Р+12] 
$ИГ БАХ, 2 
ОУ ЕВХ, 4 
хог ЕОХ. ЕОХ 
бу е8х 
| ЕСХ. ЕАХ 
му — ЕЗГ, быога ог [8+8] 
фа ЕОГ, ге 
еже: 
горрз ХММ, [Е5Г] 
моуир$ [01], М0 
аа ЕЗТ. 16 
га — ЕП, 16 
вас ВХ 
м нрхе 
сир Ех. 0 
$2 ее 
ЮУ ЕСХ, ЕСХ 
“деж: 
гср$$ ХМИО. [Е$Г] 
005$ [10], ХМ 
га Е, 4 
аа — Е, 4 
вас Ех 
Зи вохЕ1 





13.3. Команды сравнения 341 


ех1{: 

]еа ЕАХ, гез 
рор ЕВР 
ге 

_гор_ех епар 
епа 


Здесь, каки в предыдущих примерах, отдельно обрабатываются 128-разряд- 
ные элементы и младшие двойные слова. В цикле пех{ выполняется параллельное 
вычисление обратных значений при помощи команды гсррз: 

пехё: 


гсррз$ ХММО, [Е$Т] 
тоуир$ [ЕОГ]. ХММО 


7  пеж 


Отдельные 32-разрядные операнды исходного массива обрабатываются в цик- 
ле пехё]: 
пехё1 : 


гсрз$ ХММО, [Е$Г] 
тоу$$ [ЕОТ], ХММо 


дп? пех&1 


Для вычисления обратных значений квадратного корня программный код 
процедуры _гср ех можно модифицировать, заменив команды гсррз и гср$5 ко- 
мандами г$4гфр$ и г$9г{5$. 


13.3. Команды сравнения 


Команды сравнения позволяют определять соответствие операндов указанным 
условиям и, в зависимости от результата сравнения, устанавливают в нужном 
элементе операнда-приемника двоичные нули (если условие не выполняется) или 
двоичные единицы (если условие выполняется). Команды сравнения могут вы- 
полняться параллельно над упакованными операндами или скалярно над млад- 
шими двойными словами. Все команды имеют два операнда: в качестве входного 
операнда, или операнда-источника, могут выступать ХММ-регистр или ячейка 
памяти (128-разрядная для параллельных команд и 32-разрядная для скаляр- 
ных). Выходным операндом, или операндом-приемником, может быть только 
один из ХММ-регистров, в котором задействованы либо 128 бит (параллельные 
команды), либо младшие 32 бита (скалярные команды). 
Группа параллельных команд: 


® стредрз — проверяет условие равенства 32-разрядных упакованных операн- 
дов и устанавливает соответствующие значения в операнде-приемнике. Со- 
держимое операнда-источника после выполнения операции не изменяется; 


® стр1Ерх — проверяет условие «меньше» (1е5з-(Бап)) для 32-разрядных упако- 
ванных операндов и устанавливает соответствующие значения в операн- 
де-приемнике. Содержимое операнда-источника после выполнения опера- 
ции не изменяется; 


342 


Глава 13 ® $5Е-расширение процессоров 1п\е! РепНит 


стр1ерз — проверяет условие «меньше или равно» (1ез5-ап-ог-едиа]) для 
32-разрядных упакованных операндов и устанавливает соответствующие 
значения в операнде-приемнике. Содержимое операнда-источника после 
выполнения операции не изменяется; 


стрипогар5 — проверяет условие «неупорядоченности» (ипогдеге) для 
32-разрядных упакованных операндов и устанавливает соответствующие 
значения в операнде-приемнике. Содержимое операнда-источника после 
выполнения операции не изменяется; 


стриедр5 — проверяет условие «не равно» (по(-едиа!-0) для 32-разрядных 
упакованных операндов и устанавливает соответствующие значения в опе- 
ранде-приемнике. Содержимое операнда-источника после выполнения опе- 
рации не изменяется; 


стри1+рз — проверяет условие «не меньше» (пот-[езз-(Вап) для 32-раз- 
рядных упакованных операндов и устанавливает соответствующие значе- 
ния в операнде-приемнике. Содержимое операнда-источника после выпол- 
нения операции не изменяется; 


стриПерз — проверяет условие «не меньше или равно» (по(-1е$$-фап-ог- 
едиа|-60) для 32-разрядных упакованных операндов и устанавливает соот- 
ветствующие значения в операнде-приемнике. Содержимое операнда-ис- 
точника после выполнения операции не изменяется; 


строгар$ — проверяет условие «упорядоченности» (ог4егеа) для 32-разряд- 
ных упакованных операндов и устанавливает соответствующие значения 
в операнде-приемнике. Содержимое операнда-источника после выполне- 
ния операции не изменяется. 


Группа скалярных команд: 


стред$$ — проверяет условие равенства младших 32-разрядных операн- 
дов и устанавливает соответствующее значение в младшем двойном слове 
операнда-приемника. Содержимое операнда-источника после выполнения 
операции не изменяется; 


стр1&р$ — проверяет условие «меньше» (1езз-пап) для младших 32-разряд- 
ных упакованных операндов и устанавливает соответствующее значение 
в младшем двойном слове операнда-приемника. Содержимое операнда-ис- 
точника после выполнения операции не изменяется; 


стр1ерз$ — проверяет условие «меньше или равно» (]ез$-{Вап-ог-едиа]) для 
младших 32-разрядных упакованных операндов и устанавливает соответ- 
ствующее значение в младшем двойном слове операнда-приемника. Со- 
держимое операнда-источника после выполнения операции не изменяется; 


стрипогар5 — проверяет условие «неупорядоченности» (ипог4еге@) для 
младших 32-разрядных упакованных операндов и устанавливает соответ- 
ствующее значение в младшем двойном слове операнда-приемника. Со- 
держимое операнда-источника после выполнения операции не изменяется; 
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® стрпедрз — проверяет условие «не равно» (по(-едиа]-(0) для младших 32-раз- 
рядных упакованных операндов и устанавливает соответствующее значе- 
ние в младшем двойном слове операнда-приемника. Содержимое операн- 
да-источника после выполнения операции не изменяется; 


® стри!{рз — проверяет условие «не меньше» (по{-[е5$-ап) для младших 
32-разрядных упакованных операндов и устанавливает соответствующее 
значение в младшем двойном слове операнда-приемника. Содержимое опе- 
ранда-источника после выполнения операции не изменяется; 


® стриерз — проверяет условие «не меньше или равно» (по{-е5$-(фап-ог- 
едиа|-в0) для младших 32-разрядных упакованных операндов и устанавли- 
вает соответствующее значение в младшем двойном слове операнда-при- 
емника. Содержимое операнда-источника после выполнения операции не 
изменяется; 


® строгарз — проверяет условие «упорядоченности» (ог4еге) для младших 
32-разрядных упакованных операндов и устанавливает соответствующее 
значение в младшем двойном слове операнда-приемника. Содержимое опе- 
ранда-источника после выполнения операции не изменяется. 


В листинге 13.15 приводится несложный пример использования двух команд 
(стредр$ и стредз$) в процедуре _стр_ех, выполняющей сравнение элементов двух 
массивов, элементами которых являются числа с плавающей точкой в коротком 
формате. Процедура принимает три входных параметра: адреса двух массивов 
и размер любого из них в байтах (предполагается, что размер массивов одина- 
ков). Параметры извлекаются посредством регистра ЕВР, а результат процедура 
возвращает в регистре ЕАХ (адрес целочисленного массива, содержащего резуль- 
таты сравнения). 


Листинг 13.15. Сравнение элементов массивов 


.686 
.подей РТа* 
„ХММ 
ор1оп сазетар:попе 
.дата 
гез 06 32 В\Р (0) 
.соде 
_стр_ех ргос 
ризи ЕВР 


моу ЕВР, ЕЗР 
тоу ЕАХ. Чмога рёг [ЕВР+16] 


$Иг ЕАХ. 2 
тоу ЕВХ, 4 
хог ЕбХ, ЕБХ 
Ч1у ЕВХ 


тоу ЕСХ. ЕАХ 
оу ЕЗГ, @мога рёг [ЕВР+8] 
тоу ЕОГ. @мога р&г [ЕВР+12} 


Теа ЕВХ. гез продолжение „2 
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Листинг 13.15 (продолжение) 


пехе: 
тоуурз ХММ. [Е$Г] 
стрецр$ ХММО, [ЕТ] 
тоуур5 [ЕВХ], -ХМИ0 


аа4 -Е$Г. 16 
ач +ЕОГ, 16 
а44 -ЕВХ. 16 
дес ЕСХ 
ух `пехе 
стр ЕОХ. 0 
зе -ех1* 
оу ЕСХ. ЕВХ 
Вох: 


п0у5$  ХМ0. ЕП 
стрео$$ ХММО, [Е0Т] 
юу5$  [ЕВХТ. ХММ0 


ад ЕЗТ. 4 
а49 ЕОГ. 4 
аа ЕВХ. 4 
дес ЕСХ 
ли пох 

ех1е: 
Теа ЕАХ, ге5 
рор ЕВР 
ге 

_стр_ех епар 

епа 


В этой процедуре обработка элементов массивов, как и в предыдущих приме- 
рах, разбивается на два этапа. В начале сравниваются 128-разрядные элементы 
при помощи команды стредрз в цикле пех: 


пех: 
тоуир$ ХММО. [Е$Т] 
стрепр$ ХММО, [ЕОГ] 
тоуир$ [ЕВХ], ХММО 


дм пех 


Затем в цикле пех{1 сравниваются оставшиеся отдельные 32-разрядные эле- 
менты: 


пех] : 
тоу$$  ХММО, [Е51Г] 
стред$$ ХММО. [ЕОГ] 
тоу5$  [ЕВХ]. ХММ0 


ди пехё1 


После обработки всех элементов массив гез будет содержать двойные слова, 
каждое из которых состоит либо из одних нулей, либо из одних единиц. Процеду- 
ра возвращает адрес этого массива в регистре ЕАХ. 

Для тестирования процедуры _стр_ех была создана простая программа на \15иа| 
С++.МЕТ, выводящая результат сравнения на экран (листинг 13.16). 
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Листинг 13.16. Демонстрационная программа для процедуры из листинга 13.15 
исТиде <$410.1> 

ехбегп "С" ипз1дпей 1пе* стр_ех(ГТоаф* а1, Т10а1* а2. 1п а$12е):; 

116 пати(у019) 


{ 

_ес1$рес(а1191(16)) ТТоаЁ а1[7] = { 44.22. 18.74, 0.66. 82.50. 524.09, 11.55. 38.02}: 
_9ес1$рес(а1191(16)) РТоаф а2[7] = { 44.22. 18.74. 0.65. 81.51. 524.09. 11.55. 38.02}; 
11% а$12е = $12е01(а1); 

ип$1дпед 1пё* рстр = стр_ех(а1, а2. а$12е): 

рг1ипЕТ( "СМРЕДР$-СМРЕОЗ$ ехатр1е:\п"); 

Рог (116 11 = 0:11 < а$12е / 4; 11++) 


{ 
реТпЕР(”ЖХИ ", *рстр++): 
} 


геиги 0: 


} 


Как обычно, процедура _стр_ех должна быть объявлена с директивой ежеги. 
Обратите внимание на тип возвращаемого процедурой значения — это указатель 
на беззнаковое целое число (ип$1дпей 1п{*). Что же касается ключевых слов 
__ 9ес1$рес(а119п(16)), то их назначение мы уже рассматривали. При указанных зна- 
чениях элементов массивов результат, выводимый на экран, будет выглядеть так: 


СМРЕОР$-СМРЕЦЗ$ ехатр]е: 
ЕРЕРЕЕРЕН РЕРРЕРЕРИ Оп Он РЕРРЕРЕРИ ЕЕЕЕРЕРЕИ РЕРЕЕРЕРИ 


Это означает, что элементы с индексами 2 и 3 массивов а! и а2 не равны между 
собой. 

В группу команд сравнения входят еще две команды: с0т15$ и исот15$. Ко- 
манды имеют два операнда и выполняют скалярное сравнение младших 32-раз- 
рядных операндов. Особенностью этих команд является то, что содержимое 
обоих операндов после выполнения операции сравнения остается неизменным, 
но в регистре флагов ЕЁЕАб$ процессора определенным образом устанавливаются 
флаги 72, РЕ и СЕ, а флаги ОЕ, $Е и АЕ сбрасываются в 0. В качестве входных операн- 
дов обеих команд могут выступать ХММ-регистры или 32-разрядные перемен- 
ные в памяти, выходными операндами могут быть только ХММ-регистры. 

Команды исот1$$ и с0т15$$ отличаются тем, что генерируют исключительные 
ситуации для различных форматов не-чисел (МАМ). Эти команды очень удобны 
при организации ветвлений в программах, поскольку по состоянию флагов по- 
зволяют интерпретировать результат сравнения. В табл. 13.1 приводится соотно- 
шение между сравниваемыми операндами и устанавливаемыми флагами. 


Таблица 13.1. Результат сравнения и состояние флагов 


Результат сравнения операндов ор] и ор2 Флаг 2Е Флаг РЕ Флаг СР 
Операнды неупорядочены (ипогдегеа) 1 1 1 
ор1 < ор2 0 0 1 
ор1 > ор2 0 0 0 
ор! = ор2 1 0 0 
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В листинге 13.17 приводится пример использования команды с0т1$$ в проце- 
дуре, выполняющей сравнение двух чисел с плавающей точкой (назовем их а] 
и а2), адреса которых являются для нее входными параметрами. Процедура назы- 
вается _сот1$$_ех и по завершении возвращает в регистре ЕАХ адрес строки, содер- 
жащей сообщение о результате сравнения. 


Листинг 13.17. Сравнение чисел с плавающей точкой, находящихся в двух массивах 


.686 
лоде] Раф 
ор\1оп сазетар: попе 
„ХММ 
чата 
зедиа] 0В "а1 =-а2". 0 
поф едиа! ОВ "а поё ециа1 а2", 6 
сове 
_ 6015$ ех ргос 
ризп  ЕВР 
тоу ЕВР. :Е5Р 


оу ЕСТ, -Чмюга рЕгТЕВР+8] 
тоу  Е0Т. дога рёгТЕВР+12} 
10у5$ ХММО. [Е5Т] 
сои! 5$ ХММО. [Е0Т] 


Тай! 
апа АН, 45И 
сир АН. 408 


3е орз_едиа1 
Теа ЕАХ. -по® едиа1 


дар ех1е 
орз=еаиа1: 

Теа ЕАХ. =диа1 
ех1{: 

рор ЕВР 

ге 
_с0т1$$_ех епар 
ета 


Исходный текст процедуры несложен, поэтому подробно останавливаться на 
нем я не буду. Выделю лишь три команды, которые, собственно, и выполняют ос- 
новную работу: 


п0у5$ ХММО. [Е5Т] 
с0т1$$ ХММ. [Е01] 


Тай! 
апа АН. 451 
стр АН. 401 


3е орз_едиа1 


Здесь команда с0т15$$ выполняет сравнение младшего 32-разрядного числа из 
регистра ХММ0, представляющего собой значение первого операнда, со вторым опе- 
рандом, находящимся по адресу в регистре ЕТ, при этом младшее 32-разрядное 
число оказывается в регистре ХММ0 с помощью команды 


по\$$ ХММО, [Е$Г] 
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Затем содержимое регистра ЕЁЕАб5 помещается в регистр АН командой Тат. 
Для определения соотношения между операндами требуется анализ 3 бит регист- 
ра АН, соответствующих флагам 2Е, РЕ и СЕ (рис. 13.14). 





Рис. 13.14. Содержимое регистра АН после выполнения команды |а[Ё 


Предварительно замаскируем ненужные биты регистра АН при помощи команды 
ап АН, 451 


Далее, сравним содержимое регистра со значением 40} (признак равенства 
операндов, как показано в табл. 13.1), после чего выполним переход на нужную 
ветвь процедуры командой 


37 орз_едиа1 


Если операнды равны, процедура возвращает строку едца1, если не равны — 
строку по{_едиа1. Тестирование процедуры _с0т15$_ех можно выполнить с помо- 
щью следующей программы из листинга 13.18. 


Листинг 13.18. Демонстрационная программа для процедуры из листинга 13.17 


Нистиае <5{910.Н> 
ехфегп “С" спаг* сот1$$_ ех(1Тоае* а1, Гоа1* а2); 
Ти ма1п(уота) 


{ 

Поа* а] = -34.71; 

Поаё а2 = -34.71; 

рг1иЕР( "СОМТ5$ ехатр1е: %5\п”". сот1$$_ех(8а1. 8а2)): 
гебигп 0; 


} 


При желании случаи «больше» и «меньше» для только что рассмотренной за- 
дачи читатель сможет проанализировать самостоятельно. 

Перейдем к следующей группе команд, позволяющих выполнять взаимное 
преобразование значений, представленных тремя типами данных: целыми числа- 
ми в формате ММХ, числами с плавающей точкой в коротком формате ($5Е) 
и обычными 32-разрядными числами. 


13.4. Команды преобразования 


Команды преобразования могут выполняться, как и большинство остальных 
З$Е-команд, в параллельном и скалярном контекстах. К этой группе команд от- 
носятся: 


® с\р52р1 — параллельное преобразование двух младших упакованных 32-раз- 
рядных чисел с плавающей точкой в коротком формате в два 32-разрядных 
целых числа. Команда имеет два операнда. В качестве входного операнда 
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могут выступать ХММ-регистр или 128-разрядная ячейка памяти. Выход- 
ным операндом может служить один из регистров ММХ. На результат пре- 
образования влияет установка битов поля гс, определяющего режим округ- 
ления, регистра управления/состояния (МХС$К); 


С\{55251 — скалярное преобразование младшего 32-разрядного числа с пла- 
вающей точкой в коротком формате в 32-разрядное целое число. Команда 
имеет два операнда. В качестве входного операнда могут выступать ХММ- 
регистр или 128-разрядная ячейка памяти. Выходным операндом может 
служить один из 32-разрядных регистров общего назначения. Как и для ко- 
манды суёрз2р1, на результат преобразования влияет установка битов поля гс, 
определяющего режим округления, регистра управления/состояния (МХС5К); 


су :рз2р1 — параллельное преобразование двух младших упакованных 
32-разрядных чисел с плавающей точкой в коротком формате в два 32-раз- 
рядных целых числа путем отсечения дробной части исходных операндов. 
Команда имеет два операнда. В качестве входного операнда могут высту- 
пать ХММ-регистр или 128-разрядная ячейка памяти. Выходным опе- 
рандом может служить один из ММХ-регистров. Установка битов поля гс, 
определяющего режим округления, регистра управления/состояния (МХС$В) 
на результат не влияет; 


с\{15$251 — скалярное преобразование младшего 32-разрядного числа с пла- 
вающей точкой в коротком формате в 32-разрядное целое число путем от- 
сечения дробной части входного операнда. Команда имеет два операнда. 
В качестве входного операнда могут выступать ХММ-регистр или 128-раз- 
рядная ячейка памяти, а выходным операндом может служить один из 
32-разрядных регистров общего назначения. Установка битов поля гс, оп- 
ределяющего режим округления, регистра управления/состояния (МХС$В) 
на результат не влияет; 


сУЁр12р5 — преобразование двух целых 32-разрядных чисел со знаком в два 
32-разрядных числа с плавающей точкой в коротком формате. Команда имеет 
два операнда. В качестве входного операнда, или операнда-источника, может 
выступать ММХ-регистр или 64-разрядный операнд в памяти. Выходным 
операндом может служить только ХММ-регистр. Результат преобразова- 
ния помещается в младшие два 32-разрядных элемента ХММ-регистра, 
старшие два элемента остаются без изменений. На результат преобразова- 
ния влияет установка битов поля гс, определяющего режим округления, 
регистра управления/состояния (МХС$К); 


с\{$1255 — преобразование 32-разрядного числа в целочисленном формате 
в 32-разрядное число с плавающей точкой в коротком формате. Команда 
имеет два операнда. В качестве входного операнда, или операнда-источника, 
может выступать 32-разрядный регистр общего назначения или операнд 
в памяти. Выходным операндом может служить только ХММ-регистр. 
Результат преобразования помещается в младший 32-разрядный элемент 
ХММ-регистра, при этом три старших элемента остаются без изменений. 
На результат преобразования влияет установка битов поля гс, определяю- 
щего режим округления, регистра управления/состояния (МХС$В). 
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После описания команд преобразования рассмотрим пример их практическо- 
го применения — продемонстрируем работу команд с\уёрз2р1 и с\Е5$2$1. В листин- 
ге 13.19 показан программный код процедуры . суёрзёр1_ех, в которой показан 
процесс преобразования элементов массива чисел с плавающей точкой в целочис- 
ленные значения. Процедура принимает два параметра: адрес исходного массива 
вещественных чисел и его размер в байтах. Все параметры извлекаются с помо- 
щью регистра ЕВР. При этом адрес исходного массива вещественных чисел пере- 
дается в [ЕВР+8], а размер массива в байтах — в [ЕВР+12]. Результат преобразова- 
ния возвращается в регистре ЕАХ в виде адреса массива целых чисел. 


Листинг 13.19, Преобразование элементов массива чисел с плавающей точкой 
в целочисленные значения 
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Работа этой процедуры построена по тому же принципу, что и в рассмотрен- 
ных ранее примерах: элементы массива обрабатываются группами с помощью па- 
раллельных команд, а те элементы, которые остались вне этих групп, обрабатыва- 
ются скалярными командами. В данном случае мы оперируем 64-разрядными 
операндами (два двойных слова), которые обрабатываются командой с\+рз2р1 
с 32-разрядными операндами (команда с\{ 55251). 

Таким образом, в программе работают два цикла: в одном обрабатываются 
64-разрядные элементы, в другом — 32-разрядные. Рассмотрим практическую 
реализацию кода. Вначале определяем значения счетчиков циклов: 

тоу ЕАХ, дога рёг [ЕВР+12] 

иг ЕАХ. 2 

тоу ЕВХ. 2 


хог ЕОХ. ЕОХ 
лу ВХ 


После выполнения этого фрагмента кода регистр ЕАХ будет содержать количество 
64-разрядных элементов, а рогистр ЕБХ — количество оставшихся 32-разрядных 
операндов. Следующая команда помещает значение счетчика цикла в регистр ЕСХ: 


тоу ЕСХ, ЕАХ 


Затем начинается обработка 64-разрядных элементов в цикле пех: 


пех: 

тоу]1р$  ХММО. [Е$Г] 
СсУфр$2р1 ММО. ХММо 
ее] [Е013. ММО 


иг | пех 
Здесь элементы исходного массива загружаются в младшие два двойных сло- 
ва регистра ХММО командой 
тмоу1р$ ХММО, [Е$1) 
Затем следующая команда преобразует два 32-разрядных числа с плавающей 


точкой, находящиеся в младших разрядах ХММ0, в целочисленный формат и поме- 
щает два 32-разрядных целых числа в регистр ММО: 


субрзёр1 ММО. ХММо 

Содержимое регистра ММО помещается в массив гез командой 

поуа [Е0Т]. ММО 

В массиве гез и хранится результат преобразования. 

После завершения цикла пех{, если остались необработанные одиночные 


32-разрядные элементы (содержимое регистра ЕСХ отлично от нуля), начинается 
выполнение цикла пех]: 
пех]: 
ПО\У5$ ХМмО. [Е$5Т) 


С\4$$25$1 ЕАХ. ХММ0 
ОУ [Е01]. ЕАХ 


тг пех+1 
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Обработка оставшихся элементов исходного массива осуществляется при помо- 
щи скалярных команд, оперирующих с 32-разрядными элементами. Здесь коман- 
да тоуз$ ХММО. [ЕЗГ] загружает 32-разрядное число с плавающей точкой в младшее 
двойное слово регистра ХММО, после чего команда с\Ё5$2$1 ЕАХ, ХММО преобразует чис- 
ло к целочисленному формату и сохраняет его в регистр ЕАХ. Замечу, что в каче- 
стве регистра-приемника в этой команде можно использовать и другой регистр, 
например ЕВХ. 

После окончания преобразования всех элементов исходного массива в цело- 
численные значения команда Теа ЕАХ. гез помещает адрес массива, где хранятся 
результаты, в регистр ЕАХ, после чего происходит выход из процедуры. 

Работоспособность процедуры _с\&рз2р1_ех можно легко проверить с помощью 
программы на \!5ща] С++ МЕТ (листинг 13.20). 


Листинг 13.20. Демонстрационная программа для процедуры из листинга 13.19 


ЯНпсТиде <$940.1> 
ехбегп “С” 1п%* субрз2р1_ех(ТТоай* а]. 1пЕ а$12е); 
11 ма1п(у019) 


{ 
__дес1$рес(а119п(16)) РТоах а1[9] = {-56.3. -11.49. 23.04. 477.59, -6.51. 45.81. -781.21. 
233.76}: 

11% а$12е = $12е01(а1); 

ре1иЕР("СУТРУ2РТ ехатр1е:\п”); 

116* р11 = суёр$2р1_ех(а1, а$12е): 

Тог (11 11 = 0: 11 < 8;11++) 


{ 
рг1пЕР("%4 ”. *р11++): 
} 


геигп 0: 


} 
При указанных значениях элементов массива а1 программа выводит такой ре- 
зультат: 


С\УТР52Р1 ехатр1е: 
-56 -11 23 478 -7 46 -781 234 


Как видно из результата, вещественные числа массива а1 были округлены к бли- 
жайшему целому числу. Обычно этот режим задается по умолчанию при инициали- 
зации процессора (поле гс регистра МХСЗВ). Во многих случаях требуется изме- 
нить режим округления, например выполнить округление к большему значению. 
Сейчас мы посмотрим, как можно установить режим округления программными 
средствами. 

В начале главы мы рассматривали назначение полей регистра управления/со- 
стояния (МХС$В). Напомню, что биты 13-14 (поле гс) определяют режим округле- 
ния. По умолчанию это поле содержит значение 00, то есть округление выполня- 
ется в сторону ближайшего числа. Наш следующий пример продемонстрирует 
обработку данных в случае, когда принят режим округления в меньшую сторону 
(биты 13-14 регистра МХС5А должны быть установлены в {1 и 0 соответственно). 

Воспользуемся программным кодом только что рассмотренной процедуры 
_с\ёрз2р1_ех и модифицируем его. В новой процедуре (она называется _су* под) 
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перед обработкой массива вещественных чисел устанавливается режим округле- 
ния к меньшему числу. После этого выполняются те же операции, что и в проце- 
дуре _су%р$2р1_ех. Исходный текст процедуры _с\&_тод приведен в листинге 13.21. 


Листинг 13.21. Округление элементов массива чисел с плавающей точкой к меньшему 
целому числу 
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Исходный текст процедуры _с\ под во многом похож на тот, что мы рассмат- 
ривали при анализе предыдущего примера, поэтому я остановлюсь только на сде- 
ланных изменениях. 

Начнем с области данных. Здесь добавлены следующие поля: 


$фафе ТаБе1 дога 
зфафе 10и 00 
м0 


Метка 5(а{е указывает на область данных размером в одно двойное слово, в ко- 
торой будет храниться содержимое регистра МХС5В. Поскольку нас интересуют 
только младшие 16 бит состояния, то здесь же определена переменная $фа1е_10м, 
с которой и будут проводиться необходимые манипуляции. Такая форма записи 
выбрана для того, чтобы сделать более понятной последовательность команд для 
задания нового режима округления. 

В секции кода добавлены команды, задающие режим округления в сторону 
меньшего значения: 


$4тхс$г збафе 
ог збаце_1ом. 20008 
}9тхсзг $фабе 


Первая из этих команд, $4тхсзг 5фафе, сохраняет содержимое регистра МХС$К 
в области данных $фате. Далее, нам нужно присвоить битам 13-14 младшего слова 
значение 10, не затрагивая остальные разряды. Это делает команда 


ог З{афе_1Том. 20008 


Наконец, загрузим новое двойное слово состояния обратно в регистр МХС$8 
с помощью команды 19тхс$г 5файе. После выполнения этой команды округление 
будет выполняться в меньшую сторону. 

Для проверки работоспособности процедуры можно выполнить программу, 
написанную на С++. Результат должен выглядеть так: 


СУТРЗ2РТ ехатр1е: 
-57 -12 23 477 -7 45 -782 233 


Если нужно установить режим округления к большему числу, то можно вос- 
пользоваться следующими командами: 


$фтхс$г $фафе 
ог Зфате_1ом. 40008 
19тхсзг зфафе 


Если нужно просто отбросить дробную часть, то следует выполнить команды 


$&тхсзг $фабе 
ог $фафе_10м, 60000 
Татхсзг зтафе 


На этом закончим анализ команд преобразования. При желании читатели 
могут протестировать возможности преобразования из целочисленного формата 
в формат чисел с плавающей точкой. 

Следующая группа команд 55Е-расширения, которую мы рассмотрим, — ло- 
гические команды. 
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13.5. Логические команды 


В отличие от большинства команд 5$Е-расширения, все логические команды яв- 
ляются параллельными и позволяют выполнять операции логического И, ИЛИ, 
И-НЕ, исключающего ИЛИ над отдельными парами битов операндов: 


® апарз — параллельная операция логического И над парами битов упакован- 
ных чисел с плавающей точкой операнда-источника и операнда-приемни- 
ка. Команда имеет два операнда: в качестве входного операнда (источника) 
могут выступать ХММ-регистр или 128-разрядная ячейка памяти, а в каче- 
стве выходного (приемника) — ХММ-регистр. После выполнения коман- 
ды содержимое операнда-источника не изменяется, а результат помещает- 
ся в операнд-приемник; 


® ап0прз — параллельная операция логического И-НЕ над парами битов упа- 
кованных чисел с плавающей точкой операнда-источника и операнда- 
приемника. Команда имеет два операнда: в качестве входного операнда 
(источника) могут выступать ХММ-регистр или 128-разрядная ячейка 
памяти, а в качестве выходного (приемника) — ХММ-регистр. После вы- 
полнения команды содержимое операнда-источника не изменяется, а ре- 
зультат помещается в операнд-приемник; 


® огр — параллельная операция логического ИЛИ над парами битов упако- 
ванных чисел с плавающей точкой операнда-источника и операнда-прием- 
ника. Команда имеет два операнда: в качестве входного операнда (источ- 
ника) могут выступать ХММ-регистр или 128-разрядная ячейка памяти, 
а в качестве выходного (приемника) — ХММ-регистр. После выполнения 
команды содержимое операнда-источника не изменяется, а результат по- 
мещается в операнд-приемник; 


® хогр — параллельная операция логического исключающего ИЛИ над па- 
рами битов упакованных чисел с плавающей точкой операнда-источника 
и операнда-приемника. Команда имеет два операнда: в качестве входного 
операнда (источника) могут выступать ХММ-регистр или 128-разрядная 
ячейка памяти, а в качестве выходного (приемника) — ХММ-регистр. По- 
сле выполнения команды содержимое операнда-источника не изменяется, 
а результат помещается в операнд-приемник. 


Логические команды могут использоваться для изменения знака числа, пои- 
ска абсолютного значения числа (модуля) и организации ветвлений в программах. 
Далее показан пример программного кода, выполняющего поиск абсолютного 
значения чисел в массиве и реализованного в виде процедуры _тод_ех. Помимо 
других команд в процедуре используется команда хогрз. 

Процедура принимает один параметр — адрес массива чисел с плавающей точ- 
кой. Для упрощения полагаем, что массив состоит из 4 двойных слов. Результат 
вычисления возвращается в регистре ЕАХ, в который помещается адрес массива 
с абсолютными значениями. Исходный текст процедуры _тод_ех показан в ли- 
стинге 13.22. 
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Листинг 13.22. Поиск абсолютных значений элементов массива чисел с плавающей точкой 
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Алгоритм работы процедуры основан на поиске максимальных элементов в па- 
рах 32-разрядных упакованных чисел, находящихся в регистрах ХММ и ХММ!. При 
этом один из регистров будет содержать исходные значения, а другой — значе- 
ния с противоположным знаком. Используя команду пахрз, можно выбрать мак- 
симальное из двух значение, которое в любом случае является положительным 
числом. 

Программный код процедуры несложен. Вначале исходное значение 128-раз- 
рядного операнда помещается в регистр ХММО командой 


моуир$ ХММО. [Е5Н 

Далее, следующая команда обнуляет значения упакованных операндов реги- 
стра ХММ1: 

хогр$ ХММ1, ХММ1 

После выполнения команды $и6р$ ХММ1, ХММО регистр ХММ1 будет содержать зна- 
чения, противоположные по знаку исходным. Наконец, команда тахрз ХММ1. ХММО 
вычисляет большие значения из пар 32-разрядных операндов и помещает их в ре- 


гистр ХММ1. 
Результат вычисления сохраняется в массиве ге при помощи команды 


моуир$ [ЕБТ], ХММ] 
Предпоследняя команда сохраняет адрес массива гез с результатами: 
]Теа ЕАХ. гез 


После этого происходит выход из процедуры. 
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13.6. Команды управления состоянием 


К группе команд управления состоянием относятся команды, выполняющие за- 
грузку/сохранение регистров состояния и управления: 


]атхс$г — загрузка регистра управления/состояния (МХС5В) содержимым 
32-разрядной ячейки памяти, которая и является единственным операндом; 


$4тхс5г — сохранение содержимого регистра управления/состояния (МХС$В) 
в 32-разрядной ячейке памяти, которая и является единственным операндом; 


Ехг5фог — загрузка предварительно сохраненного состояния сопроцессора, 
ММХ- и ЗЕЕ-расширения из области памяти размером 512 байт. В качест- 
ве операнда выступает адрес области памяти, который должен быть выров- 
нен по 16-байтовой границе; 


Ехзаме — сохранение состояния сопроцессора, ММХ- и $$Е-расширения 
в область памяти размером в 512 байт. В качестве операнда выступает ад- 
рес области памяти. 


13.7. Команды распаковки данных 


Вг руппу команд распаковки данных входят две команды: 


ипрскИр$ — параллельное перемещение старших двойных слов из операн- 
да-источника и операнда-приемника в операнд-приемник. При этом два 
старших двойных слова операнда-источника становятся старшими двой- 
ными словами в 64-разрядных элементах операнда-приемника, а два стар- 
ших двойных слова операнда-приемника — младшими двойными словами 
в 64-разрядных элементах операнда-приемника. Входным операндом (источ- 
ником) могут выступать ХММ-регистр или 128-разрядная ячейка памяти, 
в качестве выходного операнда должен выступать ХММ-регистр. Схема 
работы команды показана на рис. 13.15. 


упрскпр$ ХММО, ХММ1 





хммо 
Рис. 13.15. Схема работы команды ипрсКПрз 


ипрсК1рз — параллельное перемещение младших двойных слов из операн- 
да-источника и операнда-приемника в операнд-приемник. При этом два 
младших двойных слова операнда-источника становятся старшими двой- 
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ными словами в 64-разрядных элементах операнда-приемника, а два млад- 
ших двойных слова операнда-приемника — младшими двойными словами 
в 64-разрядных элементах операнда-приемника. Входным операндом (источ- 
ником) могут выступать ХММ-регистр или 128-разрядная ячейка памяти, 
в качестве выходного операнда должен выступать ХММ-регистр. Схема 
работы команды показана на рис. 13.16. 


ипрсКрз ХММО, ХММ1 





127 0 
хммо 


Рис. 13.16. Схема работы команды ипрсКр$ 


К командам распаковки данных можно отнести и команду зНи{рз, выполняю- 
щую перестановку 32-разрядных упакованных операндов в соответствии с задан- 
ной маской. Команда имеет три операнда: входной, выходной и операнд-маску. 
Маска представляет собой непосредственное 8-разрядное значение, задающее по- 
рядок перестановки операндов. Каждая пара битов маски определяет номер упа- 
кованного 32-разрядного операнда в приемнике или источнике, который должен 
помещаться в операнд-приемник. При этом порядок размещения 32-разрядных 
операндов таков: младшие 4 бита маски указывают номера двух упакованных 
чисел приемника, которые становятся младшими упакованными значениями 
результата, а старшие 4 бита — номера упакованных чисел источника, которые 
становятся старшими упакованными значениями результата. 

Должен заметить, что все перестановки выполняются одновременно, то есть 
параллельно. Лучше всего схему работы команды иллюстрирует рис. 13.17. 


пир ХММО, ХММ1, 7АК 





хммо 





"У, 


Маска: ТАН = | 01 | 11 | 10 | 10 | 
Рис, 13,17. Схема работы команды $Нийр$ 
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Как видно из рис. 13.17, младшие пары битов маски равны 10, то есть 2, поэто- 
му оба младших операнда результата будут содержать элемент Х2. Старшие пары 
битов маски равны 11 (3) и 01 (1), поэтому старшие элементы результата будут 
содержать \1 и \3. 

Продемонстрирую работу команды $Ни?рз на примере простой процедуры (на- 
зовем ее _<НиРрз_ех), исходный текст которой показан в листинге 13.23. 


Листинг 13.23. Применение команды $НиЁр5 


.686 
.юде] Еаф 
„ХММ 
ор1оп сазетар:попе 
.дафа 
гез 00 4 МР (0) 
.соде 
_зпиРрз_ех ргос 
ризп  ЕВР 
оу ЕВР, ЕЗР 


Ве ЕЗГ, дога руг [ЕВР+8] 
Ве ЕОГ. @мога рег [ЕВР+12] 
]еа ЕВХ. гез 

поуир$ ХММО. [Е$Г] 

поуир$ ХММ1. [Е01] 

Зпифр$ ХММО. ХММ]. 7АП 

поуир$ [ЕВХ]. ХММ0 

Теа ЕАХ, гез 


рор ЕВР 

геё 
_$пи?рз_ех епар 
епа 


Процедура принимает два параметра — адреса двух массивов чисел с плаваю- 
щей точкой. Кроме того, для упрощения вычислений предположим, что оба мас- 
сива содержат 4 элемента размером в двойное слово. 

Параметры извлекаются при помощи регистра ЕВР, при этом адрес первого 
массива загружается в регистр ЕЗТ, адрес второго — в ЕБТ, а адрес массива гез, со- 
держащего результат, — в регистр ЕВХ. 

После этого поместим первое 128-разрядное значение (4 двойных слова пер- 
вого массива) в регистр ХММО (команда тоуир$ ХММО. ГЕЗТ]), а второе 128-разрядное 
значение (4 элемента второго массива) в регистр ХММ1 (команда поуир$ ХММ1, [ЕОТ]). 
Наконец, выполним перестановку упакованных операндов, используя маску 7АВ, 
при помощи команды 


эпиРр$ ХММО. ХММ1. 7АВ 

Полученный в регистре ХММО результат поместим в массив гез командой 
по\ир$ [ЕВХ]. ХММ0 

Предпоследняя команда процедуры помещает адрес результата в регистр ЕАХ: 
Теа ЕАХ. гез 


После этого происходит выход из процедуры. 
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Чтобы посмотреть на результат работы процедуры _$ПиТрз_ех, воспользуемся 
консольной программой на \15иа] С++ МЕТ (листинг 13.24). 


Листинг 13.24. Демонстрационная программа для процедуры из листинга 13.23 


ЗАпсТиде <$Е91о.Н> 
ехфегп "С" ТТоах* эпиРрз_ех(Тоае* 11. Роац* 12); 
116 та1п(\014) 


{ 

Ноа 11[4] = { 1.11. 2.22. 3.33. 4.44}; 
Поат 12[4] = { -1.11. -2.22. -3.33, -4.44 }; 
Поа* рЁ = зНирз_ех(11. 12); 
ргТПЕР("ЗНУЕР$ ехатр1е:\п”): 

Фог (11 11 =0: 11 <4: ++) 


{ 
рг1пЕР ("55.2 ". *р{++): 


гефигп 0: 


} 
Если запустить программу, то на экран будет выведен такой результат: 


ЗНИЕРЗ ехатр1е: 

3.33 3.33 -4.44 -2.22 

Этот результат соответствует той схеме, которая показана на рис. 13.17: эле- 
менты с номером 2 регистра ХММО (а это 3,33) помещаются в младшие двойные 
слова результата, а элементы с номерами 3 (-4,44) и 1 (-2,22) регистра ХММ1 — 
в старшие двойные слова результата, который оказывается в регистре ХММ0. 

Команду зНирз можно задействовать для различных манипуляций упакован- 
ными элементами, причем с ее помощью можно реализовывать довольно серьез- 
ные алгоритмы. Вот простейший вариант такого использования команды зПи{рз: 
пусть требуется поменять порядок следования элементов в 128-разрядном опе- 
ранде, то есть сделать младший операнд старшим, а старший — младшим и т. д. 
Подобную манипуляцию можно выполнить с помощью несложной процедуры 
(назовем ее _геуегзе_ех). 

Процедура принимает один параметр — адрес 128-разрядного операнда (или 
массива из четырех 32-разрядных чисел, что в данном случае одно и то же), а воз- 
вращает, как обычно, адрес массива с результатом в регистре ЕАХ. Исходный текст 
процедуры _гемегзе_ех представлен в листинге 13.25. 


Листинг 13.25. Изменение порядка следования элементов в массиве 


.686 
.Юде] ае 
„ХММ 
ор&1оп сазетар:попе ` 
.дафа 
гез 004 Р (0) 
.соде 
_гемегзе_еох ргос 
рип  ЕВР 
ту  ЕВР, ЕЗР 


ЮУ ЕЗТ. фиога рег [ЕВР+8] продолжение = 
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Листинг 13.25 (продолжение) 


Теа ЕВХ. гез 
тоуир$ ХММО. [Е$1] 
ЗПи?р$ ХММО. ХММО. 1ВА 
томир$ ГЕВХ]. ХММО 
]еа ЕАХ. ге$ 


рор ЕВР 

геё 
_геуеге_ех епар 
епа 


Это очень простая процедура, и я не буду детально ее анализировать. Хочу 
лишь обратить ваше внимание на то, как используется команда $Пи{рз: в качестве 
обоих операндов указан один и тот же регистр (в данном случае — ХММ0), а маской 
является значение 1ВВ. 

Если, предположим, исходный массив содержит элементы в следующем по- 
рядке: 


1.11 2.22 3.33 4.44 


то после выполнения процедуры _геуегзе_ех результирующий массив будет со- 
держать элементы, расположенные так: 


4.44 3.33 2.22 1.11 


На этом можно закончить обзор команд распаковки данных. Последняя груп- 
па команд, которую мы проанализируем, — команды управления кэшированием 
данных. 


13.8. Команды управления кэшированием 


Необходимость управления кэшированием вызвана тем, что большинство муль- 
тимедийных приложений оперируют большими объемами данных, при этом мо- 
жет случиться, что данные, загруженные в кэш, никогда не понадобятся. Чтобы 
оптимизировать работу кэша, в систему команд 5ЗЕ-расширения и были включе- 
ны команды управления кэшем. Вот их перечень: 


®» пазктоуа — выборочное сохранение в памяти байтов упакованных данных 
ММХ-регистра. В качестве операнда-источника используется один из 
ММХ-регистров, а операндом-приемником служит область памяти, адрес 
которой задан в регистре Е01. Маска указывает, какие байты будут сохране- 
ны в памяти, и формируется из старших разрядов каждого байта, находя- 
щегося в ММХ-регистре; 


® ПоуПа — запись в память, минуя кэш, целочисленных упакованных данных 
в формате ММХ. Операндом-источником здесь выступает ММХ-регистр, 
а операндом-приемником — 64-разрядная ячейка памяти; 


® по\упрз — запись в память, минуя кэш, упакованных чисел с плавающей точ- 
кой в коротком формате. Операндом-источником здесь выступает ХММ-ре- 
гистр, а операндом-приемником — 128-разрядная ячейка памяти, адрес 
которой должен быть выровнен по 16-байтовой границе. 
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Мы закончили анализ аппаратно-программной архитектуры 55Е-расширения 
и можем сделать некоторые выводы относительно этой технологии. Ее использо- 
вание значительно ускоряет работу приложений при обработке больших объемов 
данных при ограниченных ресурсах времени, поскольку данные могут обрабаты- 
ваться параллельно в одном цикле. Операции с упакованными числами с плаваю- 
щей точкой обладают повышенной точностью, и при прочих равных условиях 
следует отдавать им предпочтение. 

Прежде чем использовать широкие возможности, предоставляемые техноло- 
гией 55Е по оптимизации программ, следует тщательно продумать алгоритм за- 
дачи и оценить целесообразность применения этой технологии. Из-за ограничен- 
ности объема книги мы рассмотрели не все возможности З5Е, но я надеюсь, что 
читатели извлекли немалую пользу для себя и смогут эффективно задействовать 
$5Е-команды в своих программах. 


Технология $5$Е2 
в процессорах 
пе! Репнит 4 





Технология 55Е2 (54театшя 5$ МР Ехепз1опз 2) разработана для применения 
в процессорах Пе! Репйит 4. Ее назначение — повысить эффективность опера- 
ций со 128-разрядными данными в формате плавающей точки с двойной точностью 
(ЧоцЫе-ргес1$1юп Йоайпё роте) и с целочисленными данными. Эта технология 
позволяет разрабатывать высокопроизводительные приложения для ЗР-графики 
и 3В-геометрии, моделирования и симуляции процессов (и не только в матема- 
тике), обработки сигналов, ЗР-анимации, кодирования/декодирования, распо- 
знавания речи и т. д. 

Технология 55Е2 расширяет возможности ММХ за счет использования 128-раз- 
рядных регистров вместо 64-разрядных, обеспечивая высокую эффективность парал- 
лельных вычислений. Достижение более высокой производительности возможно 
также за счет включения в 55Е2 новых типов данных: 128-разрядных операндов 
с плавающей точкой двойной точности и 128-разрядных упакованных целых чисел. 
Технология 55Е2 позволяет улучшить вычислительные возможности благодаря: 


® улучшению управления данными в кэше; 


» повышению производительности операций, требующих более высокой 
точности; 


» расширению до 128 бит диапазона обрабатываемых 64-разрядными коман- 

дами операндов. 

Рассмотрим более подробно типы данных, которые использует 55Е2-расши- 
рение. Основное преимущество 55Е2 связано с применением 64-разрядных чи- 
сел с плавающей точкой двойной точности, формат которых показан на рис. 14.1. 

55Е2-команды при выполнении операций используют восемь 128-разрядных 
регистров (ХММ — ХММ7) и могут работать в скалярном или параллельном режиме. 
55Е2-команды оперируют с такими типами данных, как: 

® упакованные и скалярные числа с плавающей точкой в коротком формате; 

® упакованные и скалярные числа с плавающей точкой двойной точности; 


®» упакованные и скалярные целые числа размером 128 бит. 
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Рис. 14.1. Формат упакованного 64-разрядного числа 
с плавающей точкой двойной точности 


Команды 128-разрядной целочисленной арифметики используют тот же на- 
бор регистров (ХММО — ХММ7), что и команды, оперирующие с числами с плавающей 
точкой. Инструкции $5Е2-расширения не требуют применения команды еттз, 
поскольку выполняются вне зависимости от сопроцессора. Кроме того, $5Е2-ко- 
манды позволяют: 


® разрабатывать алгоритмы, в которых одновременно можно обрабатывать 
смешанные типы данных: упакованные числа с плавающей точкой в коротком 
формате и указанные с двойной точностью, а также целые 64- и 128-раз- 
рядные числа; 


®» работать с данными различной размерности: байтом, словом, двойным сло- 
вом, учетверенным словом и двойным учетверенным словом. 


Напомню, что с помощью параллельных команд можно одновременно обраба- 
тывать все упакованные операнды, в то время как с помощью скалярных — толь- 
ко младший операнд. Команды 5ЗЕ2-расширения в большинстве случаев требу- 
ют выравнивания адресов операндов в памяти по 16-байтовой границе, хотя из 
этого правила есть некоторые исключения, например команда загрузки, или со- 
хранения, операнда в невыровненной области памяти. Еще один случай связан с ис- 
пользованием скалярной команды, работающей с переменной размером в 8 байт 
и не требующей выравнивания. 

Мнемонические обозначения параллельных команд содержат суффикс ра, а ска- 
лярные — суффикс $4. Прежде чем приступить к анализу инструкций 55Е2-рас- 
ширения и практическим примерам, сделаю несколько уточнений. Для разработки 
ассемблерных программ, содержащих 55Е2-команды, мы будем использовать ком- 
пилятор МАЗМ 7.10-хххх (включен в \/т4о\з ХР РОК или \Лпдо\з Зегуег 2003 
РОК). Исходный текст программы на ассемблере обязательно должен содержать 
директиву .ХММ. 

При разработке ассемблерных процедур с 55Е2-командами в большинстве 
случаев требуется выравнивание адресов данных по 16-байтовой границе. С этим 
мы уже сталкивались при обсуждении 5ЗЕ-расширения в главе 13, поэтому я не 
буду больше на этом останавливаться. 
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Перед тем как разрабатывать программный код с использованием технологии 
$5Е2, необходимо убедиться в том, что процессор ее поддерживает. Для этого 
нужно, выполнив команду сри14, проанализировать 26-й бит регистра ЕОХ — если 
этот бит отличен от нуля, то технология 55Е2 поддерживается процессором. Со- 
ответствующий фрагмент программного кода может быть таким: 


$25 ирр 08 0 


тоу  ЕАХ. 1 

хог ЕВХ. ЕВХ . 
срита 

фе5Е Е0Х. 4000000 :анализ 26-го бита 

сете ВЕ 

мои  55Е25ирроге, ВЁ 


Если переменная 55Е25иррог{ после выполнения этого фрагмента кода содер- 
жит 1, то технология 55Е2 поддерживается, а если 0 — нет. 

Приступим к анализу основных групп команд 535Е2-расширения. Все коман- 
ды в зависимости от типа обрабатываемых операндов можно разделить на две 
большие группы, предназначенные для обработки 128-разрядных операндов с пла- 
вающей точкой и 128-разрядных целочисленных операндов. 


14.1. Команды обработки 128-разрядных данных 
с плавающей точкой 


В группу команд обработки 128-разрядных данных с плавающей точкой входят 
следующие команды: 


® перемещения (пересылки, передачи) данных; 


® арифметические (сложения, вычитания, умножения, деления, извлечения 
квадратного корня и поиска максимума/минимума); 


® сравнения; 
®» логических операций; 

® распаковки и распределения данных; 
» преобразования форматов данных; 

® управления состоянием вычислений; 
® управления кэшированием данных. 


Первая группа команд, которые мы рассмотрим, — команды перемещения 
данных. 
К командам перемещения данных относятся: 


® по\ара — пересылка 128-разрядных упакованных данных с плавающей точкой 
двойной точности из входного операнда (источника) в выходной операнд 
(приемник). В качестве источника и приемника могут выступать ХММ- 
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регистр или 128-разрядная ячейка памяти, при этом хотя бы один из опе- 
рандов должен быть ХММ-регистром. Адрес операнда в памяти должен 
быть выровнен по 16-байтовой границе, в противном случае генерируется 
исключение общей защиты; 


тоуйр@ — пересылка старших 64 битов ХММ-регистра в память и наобо- 
рот. Данные пересылаются из 64-разрядной ячейки памяти в старшую часть 
ХММ-регистра. В качестве операнда-источника и операнда-приемника мо- 
гут выступать ХММ-регистр или ячейка памяти. Если выполняется пере- 
сылка данных в ХММ-регистр, то младшая часть регистра не изменяется; 


пюу1ра — пересылка младших 64 битов ХММ-регистра в память и наоборот. 
Данные пересылаются из 64-разрядной ячейки памяти в младшую часть 
ХММ-регистра. В качестве операнда-источника и операнда-приемника мо- 
гут выступать ХММ-регистр или ячейка памяти. Если выполняется пере- 
сылка данных в ХММ-регистр, то старшая часть регистра не изменяется; 


тоуирд — пересылка невыровненых 128-разрядных упакованных данных 
с плавающей точкой двойной точности из входного операнда (источника) 
в выходной операнд (приемник). В качестве источника и приемника могут 
выступать ХММ-регистр или 128-разрядная ячейка памяти, при этом хотя 
бы один из операндов должен быть ХММ-регистром; 


поу$4 — пересылка скалярных данных размером 64 бит из младшей части 
ХММ-регистра в память и наоборот. Данные пересылаются из 64-разряд- 
ной ячейки памяти в младшую часть ХММ-регистра. В качестве операн- 
да-источника и операнда-приемника могут выступать ХММ-регистр или 
ячейка памяти. Если оба операнда являются ХММ-регистрами, то пересы- 
лаются младшие части регистров. Если выполняется пересылка данных из 
памяти в ХММ-регистр, то старшие 64 бита регистра устанавливаются в 0; 


поут$Кра — сохранение знаковых битов каждого 64-разрядного операнда 
с плавающей точкой двойной точности в младших битах 32-разрядного ре- 
гистра общего назначения. Это 2-разрядное значение может быть исполь- 
зовано для организации ветвлений в программе. Схема работы команды 
поут$Кра показана на рис. 14.2; 


тоутзкра ЕАХ, ХММО 
127 63 0 
хмм 





[Мок 


Рис. 14.2. Схема работы команды тоутеКра 
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мазКтюу4ди — пересылка содержимого операнда-источника в операнд-при- 
емник в соответствии с указанной маской. Команда имеет три операнда: 
операнд-источник, операнд-приемник и маску. Операнд-источник и маска 
указываются явным образом в команде, а операнд-приемник находится по 
адресу, определяемому регистром Е0!. Команда работает по следующей схе- 
ме: если знаковый бит элемента маски равен 1, то выполняется пересылка 
элемента-источника из соответствующей позиции в операнд-приемник на 
ту же позицию, а если знаковый бит равен 0, то пересылка не выполняется 
и соответствующий элемент в операнде-приемнике остается без измене- 
ний. Лучше представить себе работу команды тазктоудди поможет рис. 14.3. 


тазктоудди ХММО, ХММ1 
427 До операции 


ЧАТЕ : 


ХММ1 (маска) 





ПО О 
Го Го ов Гм Гм ме Га [но] пою 


После операции 


тетогу 





Рис. 14.3. Схема работы команды та$Ктоу4 аи 


Команда тазКтоудди позволяет создавать алгоритмы перестановки, сцепления 
и врезки элементов строк и массивов. Продемонстрирую это на примере врезки 
символов одной строки в другую. Программный код примера реализован в виде 
процедуры _тазктомади_ех (листинг 14.1). 


Листинг 14.1. Применение команды тазКтоу@ди 


.686 


„тоде] Е]а+ 


„ХММ 


орЁ1оп сазетар: попе 


.дата 


гез 08 16 СР ('+').0 


.с0де 


_мазктомади_ех ргос 


ризй 
тоу 
тоу 
ту 


ЕВР 

ЕВР. ЕЗР 

ЕЗГ. дмога рег [ЕВР+8] 
ЕВХ. Чмог@ рёг [ЕВР+12] 
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]еа ЕОГ. ге 

тмоудди ХММ. ГЕ$Т] 
помади ХММ1. [ЕВХ] 
мазктоу@ди ХММО. ХММ] 


Теа ЕАХ, гез 
рор ЕВР 
ге 
_тазктоудди_ех епар 
епа 


Процедура принимает в качестве входных параметров адреса массива байтов 
и маски. Символы исходного массива копируются в массив гез, содержащий сим- 
вол +, если соответствующий этому символу байт маски равен шестнадцатерич- 
ному значению ЕЕ, в противном случае содержимое элемента массива гез остает- 
ся неизменным. Процедура возвращает адрес массива гез в регистре ЕАХ. 

Для адресации исходного массива используется регистр Е$1, маска адресуется 
регистром ЕВХ, а операнд в памяти (массив гез) — регистром ЕТ. 

Для проверки работы процедуры можно использовать простое консольное 
приложение на \1зиа! С++ МЕТ (листинг 14.2). 


Листинг 14.2. Демонстрационная программа для процедуры из листинга 14.1 


ЗИпсТиде <$4910.1> 

ехбегп "С” ипз1дпей спаг* тазКтомади_ех( 
ип$19пеЧ спаг* а]. ип$1дпей спаг* м$К); 

18 ма1п(\019) 


{ 
__дес1$рес(а119п(16) )ип$19пей спаг а1[] = "0123456789АВСОЕР"; 
__дес1$рес(а119п(16) )ип$19пей спаг м$К[] = { 
0х0, ОхЕР. 0х0, ОхЕЕ. ОхЕР. 0х0, ОхЕЕ, ОхЕЕ, 
ОхЕР.ОхЕР, ОхЕЕ. ОхЕЕ. ОхЕР, ОхЕР, ОхЕЕ, ОХЕЕ }: 
рг1пЕ+( "МАЗКМОМОЦИ ехатрТе:\п”); 
реп т ("5оигсе $4г1п9: %$\п", а1): 
ип$19пеЧ спаг* ра1 = тазКточ@ди_ех(а1, пк); 
рг1иЕ ("Безе 1па1оп $%г1пд: #$\п". ра1); 
гебигп 0; 


} 


Здесь процедура пазКтоудци_ех объявлена как внешняя, принимающая в каче- 
стве параметра адреса массива беззнаковых символов (ипз1дпе4 спаг* а1) и маски 
(ипз1дпей спаг* м$К) и возвращающая адрес массива результата, 

При указанных значениях элементов массивов а! и пзк программа выводит на 
экран следующий результат: 

МАЗКМОУОЦУ ехатр1е: 

5оигсе ${г1п9: 0123456789 АВСОЕР 

Безё1пае1опт $%г1пд: +1+34+6789АВСВЕЕ 

В группу арифметических команд входят команды сложения, вычитания, ум- 
ножения и деления. К. этой группе очень часто относят и команды извлечения 
квадратного корня, поиска максимального и минимального элементов. Команды 
этой группы могут работать как с упакованными операндами (параллельные ко- 
манды), так и с обычными (скалярные команды). Вначале рассмотрим команды 
параллельного сложения и вычитания: 
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® 204р4 — параллельное сложение двух упакованных 64-разрядных чисел с пла- 
вающей точкой двойной точности. Команда принимает два операнда: в каче- 
стве входного операнда могут выступать ХММ-регистр или ячейка памяти, 
выходным операндом может быть только ХММ-регистр; 


® 5и6р — параллельное вычитание двух упакованных 64-разрядных чисел 
с плавающей точкой двойной точности. Команда принимает два операнда: 
в качестве входного операнда могут выступать ХММ-регистр или ячейка 
памяти, выходным операндом может быть только ХММ-регистр. Команда 
вычитает содержимое операнда-источника из содержимого операнда-при- 
емника и сохраняет результат в операнде-приемнике. 


Следующие две команды работают со скалярными данными, оперируя млад- 
шими элементами 128-разрядных значений, не затрагивая старшие: 


® а0454 — сложение младших 64-разрядных операндов с плавающей точкой 
двойной точности. Команда принимает два операнда: в качестве входного 
операнда могут выступать ХММ-регистр или ячейка памяти, выходным 
операндом может быть только ХММ-регистр; 


® 51654 — вычитание младших 64-разрядных операндов с плавающей точкой 
двойной точности. Команда принимает два операнда: в качестве входного 
операнда могут выступать ХММ-регистр или ячейка памяти, выходным 
операндом может быть только ХММ-регистр. Команда вычитает содержи- 
мое операнда-источника из содержимого операнда-приемника и сохраняет 
результат в операнде-приемнике. 


Приведу пример использования одной из команд — команды параллельного 
сложения а04ра. Соответствующий программный код, реализованный в виде про- 
цедуры а99р4 ех, позволяет вычислить сумму двух упакованных 128-разрядных 
операндов, каждый из которых представляет собой 64-разрядное число с плаваю- 
щей точкой двойной точности (листинг 14.3). Процедуре передаются адреса опе- 
рандов, а возвращаемым результатом является адрес области памяти, содержа- 
щей разность чисел. 


Листинг 14.3. Вычисление суммы 128-разрядных операндов в формате плавающей точки 
двойной ТОЧНОСТИ 


. 686 
„моде? Рае 
орё1оп сазетар: попе 
. ХММ 
.дата 
гез 00 2 ЦР (0) 
.соде 
ад9рЧ_ ех ргос 
ризп  ЕВР 
оу ЕВР. ЕЗР 


оу ЕЗГ. Чмога рег [ЕВР+8] 
| ЕОГ. Фога рёг [ЕВР+12] 
]еа ЕВХ, гез 

моуир@ ХММО. [Е51] 

аа9ря ХмМмо, [Е0Т] 
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моуира [ЕВХ]. ХММО 
]еа ЕАХ. гез 


рор ЕВР 
ге 
адар4 ех епар 
ета 


Следующий пример демонстрирует скалярное вычитание двух 64-разрядных 
чисел с плавающей точкой при помощи команды $554. Программный код представ- 
ляет собой процедуру (она называется $и5$4_ех), входными параметрами которой 
являются значения операндов (листинг 14.4). Процедура возвращает в регистре 
ЕАХ адрес области памяти гез, содержащей результат вычитания. Мнемонически 
процедуру можно представить так: 


$4654 ех(а1. а2) 


Здесь а1, а2 — входные параметры. Тогда результат выполнения процедуры 
выглядит как а1 - а2. 


Листинг 14.4. Скалярное вычитание чисел с плавающей точкой двойного формата 


. 686 
.пюде] 1а* 
орЁ1оп сазетар: попе 
„ХММ 
„дата 
гез 000 
.соде 
$6549 ех ргос 
ризй  ЕВР 
оу ЕВР, ЕЗР 


Теа ЕВХ. ге$ 

поу$9 ХММО., [ЕВР+8] 
$и5$9 ХММО. [ЕВР+16] 
тоуз@ [ЕВХ]. ХММО 
Теа ЕАХ. гез 


рор  ЕВР 

ге 
$и6$4_ех епар 
епа 


Программный код процедуры несложен, но я хочу обратить внимание читате- 
лей на то, что параметры процедуры являются 8-байтовыми числами, поэтому 
второй параметр отстоит от первого на 8 байт и адресуется как [ЕВР+16]. 

Подгруппа команд умножения включает две команды: 


® пиТра — параллельное умножение двух упакованных 64-разрядных чисел 
с плавающей точкой двойной точности. Команда принимает два операнда: 
в качестве входного операнда могут выступать ХММ-регистр или ячейка 
памяти, выходным операндом может быть только ХММ-регистр; 


® 1154 — скалярное умножение младших 64-разрядных операндов с плаваю- 
щей точкой двойной точности. Команда принимает два операнда: в качест- 
ве входного операнда могут выступать ХММ-регистр или ячейка памяти, 
выходным операндом может быть только ХММ-регистр. Команда не затра- 
гивает старшие части операндов. 
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Подгруппа команд деления включает две команды: 


Фура — параллельное деление двух упакованных 64-разрядных чисел с пла- 
вающей точкой двойной точности. Команда принимает два операнда: в каче- 
стве входного операнда могут выступать ХММ-регистр или ячейка памяти, 
выходным операндом может быть только ХММ-регистр. Команда выпол- 
няет деление содержимого операнда-приемника на содержимое операн- 
да-источника и сохраняет результат в операнде-приемнике; 


41,54 — скалярное деление младших 64-разрядных операндов с плавающей 
точкой двойной точности. Команда принимает два операнда: в качестве 
входного операнда могут выступать ХММ-регистр или ячейка памяти, вы- 
ходным операндом может быть только ХММ-регистр. Команда выполняет 
деление содержимого операнда-приемника на содержимое операнда-источ- 
ника и сохраняет результат в операнде-приемнике, не затрагивая старшие 
части операндов. 


Приведу пример процедуры, в которой вычисляется значение выражения 


а1-а2 
а1+а2’ 


где а1 и а2 — входные параметры процедуры (64-разрядные числа с плавающей 
точкой в двойном формате). Адрес результата возвращается в регистре ЕАХ. Проце- 
дура называется _сотбо_ех, и в ней используются скалярные команды а99$4, $и654 
и 91\54. Исходный текст процедуры представлен в листинге 14.5. 


Листинг 14.5. Вычисление выражения (а1 - а2)/(а1 + а2) 


.686 
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орЁ1оп сазетар: попе 
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К группе арифметических команд относят также команды извлечения квад- 
ратного корня. Существует две формы команды: $4гЕра (параллельная обработка) 
и 54г(54 (скалярная обработка): 


$гЕра — параллельное извлечение квадратного корня из двух упакован- 
ных 64-разрядных чисел с плавающей точкой двойной точности. Команда 
принимает два операнда: в качестве входного операнда могут выступать 
ХММ-регистр или ячейка памяти, выходным операндом может быть толь- 
ко ХММ-регистр; 


$47554 — скалярное извлечение квадратного корня из младших 64-разряд- 
ных операндов с плавающей точкой двойной точности. Команда принимает 
два операнда: в качестве входного операнда могут выступать ХММ-регистр 
или ячейка памяти, выходным операндом может быть только ХММ-регистр. 
Старшие операнды во время выполнения не изменяются. 


Поиск максимальных/минимальных значений выполняется при помощи 
команд тахра/т1пра (параллельная обработка) и тах$4/т1п$4 (скалярная обра- 
ботка): 


махра — параллельный поиск максимального значения в парах упакован- 
ных 64-разрядных чисел с плавающей точкой двойной точности. Команда 
принимает два операнда: в качестве входного операнда могут выступать 
ХММ-регистр или ячейка памяти, выходным операндом может быть толь- 
ко ХММ-регистр. Результат сохраняется в выходном операнде; 


т1ир@ — параллельный поиск минимального значения в парах упакован- 
ных 64-разрядных чисел с плавающей точкой двойной точности. Команда 
принимает два операнда: в качестве входного операнда могут выступать 
ХММ-регистр или ячейка памяти, выходным операндом может быть толь- 
ко ХММ-регистр. Результат сохраняется в выходном операнде; 


мах54 — поиск максимального значения в паре младших 64-разрядных опе- 
рандов с плавающей точкой двойной точности. Команда принимает два 
операнда: в качестве входного операнда могут выступать ХММ-регистр 
или ячейка памяти, выходным операндом может быть только ХММ-ре- 
гистр. Результат сохраняется в младшей части выходного операнда, не за- 
трагивая старший операнд; 


1114$ — поиск минимального значения в паре младших 64-разрядных операн- 
дов с плавающей точкой двойной точности. Команда принимает два опе- 
ранда: в качестве входного операнда может выступать ХММ-регистр или 
ячейка памяти, выходным операндом может быть только ХММ-регистр. 
Результат сохраняется в младшей части выходного операнда, не затрагивая 
старший операнд. 


В листинге 14.6 приводится пример параллельного поиска минимальных 
значений среди пар 64-разрядных операндов с плавающей точкой двойной точ- 
ности. Программный код реализован в виде процедуры _т1пр4_ех, принимающей 
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в качестве параметров адреса 128-разрядных операндов и возвращающей адрес 
результата в регистре ЕАХ. 


Листинг 14.6. Параллельный поиск минимальных значений среди пар элементов 
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Для проверки работы процедуры можно использовать простую программу, 
написанную на \У15иа| С++ МЕТ (листинг 14.7). 


Листинг 14.7. Демонстрационная программа для процедуры из листинга 14.6 


ННисТибе <$910.1> 
ехёегп "С" доибТе* пАпра_ех( бои Ле* а1, доиБе* а2); 
11% пма1п(\014) | 


{ 

__4ес15рес(а119п(16) )дои Ле а1[2] = { 345.98, 274.16 }: 
__дес15рес(а119"(16) )бои61е а2[2] = { 562.49, -712.73 }; 
доиб1е* ра = т1пра_ех(а1. а2); 

реТИЕЕС"ММРО ехатр1е:\п”); 

Рог (11% 11 = 0:11 <2; 11++) 


{ 
рг1пЕ ("$5.27 ", *ра++); 


гебигп 0; 


} 


Здесь при помощи директивы ех{егп процедура п1ирд_ех объявлена внешней. 
Кроме того, и об этом уже упоминалось, 35Е2-команды требуют, чтобы адреса 
переменных были выровнены по 16-байтовой границе. Обратите внимание на то, 
что 64-разрядным числам с плавающей точкой в двойном формате в языке \У151а] 
С++ МЕТ соответствует тип дои Ле. При указанных значениях элементов масси- 
вов а] и а2 программа выводит на экран следующий результат: 


МТМРО ехатр]е: 
345.98 -712.73 
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В группу команд сравнения входят следующие команды: 


страххра — параллельное сравнение двух пар упакованных 64-разрядных чи- 
сел с плавающей точкой двойной точности. По результату сравнения в опе- 
ранд-приемник записывается 64-разрядная маска в соответствующей пози- 
ции, состоящая либо из единиц, либо из нулей, в зависимости от результата 
сравнения. В качестве входного операнда выступают ХММ-регистр или 
ячейка памяти, выходным операндом может быть только ХММ-регистр. 
Для этой команды поддерживается набор условий, который условно обо- 
значен символами ххх (табл. 14.1). 


Таблица 14.1. Набор условий для команды стрхххра 


Код условия Описание Условие 

ед Едиа! Равно 

К Ге5$-{Пап Меньше чем 

е Те5$-{Пап-ог-едиа! Меньше чем или равно 
упогд Упогдегед Неупорядоченный операнд 
пед МоЕ-едиа! Не равно 

пк Мг-е5$-{Пап Не меньше чем 

пе Мо-е5-Фап-ог-едиа! Не меньше чем или равно 
ога Огдегед Упорядоченный операнд 


Например, следующая команда выполняет параллельное сравнение на ра- 
венство пар упакованных 64-разрядных операндов в регистрах ХММ и ХММ1: 


стреадра ХММО. ХММ1 


страхх$9 — скалярное сравнение младших частей 128-разрядных операндов. 
По результату сравнения в младшей части возвращается 64-разрядная ма- 
ска, состоящая либо из единиц, либо из нулей, в зависимости от результата 
сравнения. В качестве входного операнда выступают ХММ-регистр или 
ячейка памяти, выходным операндом может быть только ХММ-регистр. 
Старшая часть операнда-приемника во время выполнения операции не 
изменяется. Для этой команды также поддерживается набор условий ххх 
(см. табл. 14.1), которые можно включить в мнемонику команды. Напри- 
мер, следующая команда при сравнении младших 64-разрядных операндов, 
находящихся в регистрах ХММО и ХММ1, проверяет условие ХММ0 < ХММ1: 


стр1&$а ХММ, ХММ 


В группу команд сравнения входят еще две скалярные команды: сот154 и исот1 $4. 
Команды имеют два операнда и выполняют скалярное сравнение младших 64-раз- 
рядных чисел с плавающей точкой. После выполнения этих команд содержимое 
обоих операндов остается неизменным, но в регистре флагов ЕЁЁАб$ процессора 
определенным образом устанавливаются флаги 2, РЕ и СЕ, а флаги ОЕ, Е и АЕ сбра- 
сываются в 0. В качестве входных операндов обеих команд могут выступать 
ХММ-регистры или 64-разрядные переменные в памяти, выходными операнда- 
ми могут быть только ХММ-регистры. 


374 Глава 14 ® Технология $$Е2 в процессорах 1г\е! РепНит 4 


Различие команд исот1 54 и с0т1$4 состоит в том, что они генерируют исключи- 
тельные ситуации для различных форматов не-чисел (МАМ). Эти команды очень 
удобны при организации ветвлений в программах, поскольку по состоянию фла- 
гов позволяют интерпретировать результат сравнения. В табл. 14.2 приводится 
соответствие между сравниваемыми операндами и устанавливаемыми флагами. 


Таблица 14.2. Результат операций сравнения и состояние флагов 


Результат сравнения операндов ор]1 и ор2 Флаг 2Е Флаг РЕ Флаг СЕ 
Операнды неупорядочены (ипогдегеа) 1 1 1 
ор1 < ор2 0 0 1 
ор1 > ор2 0 0 0 
ор1 = ор2 1 0 0 


В группу команд распаковки и перестановки входят две команды: 


® ипрскИра — параллельное перемещение старших 64-разрядных чисел с пла- 
вающей точкой из операнда-источника и операнда-приемника в операнд-при- 
емник. При этом старший 64-разрядный элемент операнда-источника ста- 
новится старшим 64-разрядным элементом операнда-приемника, а старший 
64-разрядный элемент операнда-приемника — младшим 64-разрядным 
элементом операнда-источника. Входным операндом (источником) могут 
быть ХММ-регистр или 128-разрядная ячейка памяти, в качестве выходного 
операнда должен выступать ХММ-регистр. Схема работы команды ипрскира 
показана на рис. 14.4; 


ипрскира ХММо, ХММ1 


127 63 0 127 63 0 





хммо 
Рис. 14.4. Схема работы команды ипрскИра 


® ипрсК1рд — параллельное перемещение младших 64-разрядных чисел с пла- 
вающей точкой из операнда-источника и операнда-приемника в операнд-при- 
емник. При этом младший 64-разрядный элемент операнда-источника стано- 
вится старшим 64-разрядным элементом операнда-приемника, а младший 
64-разрядный элемент операнда-приемника — младшим 64-разрядным 
элементом операнда-приемника. Входным операндом (источником) могут 
быть ХММ-регистр или 128-разрядная ячейка памяти, в качестве выходного 
операнда должен выступать ХММ-регистр. Схема работы команды ипрсК1ра 
показана на рис. 14.5. 
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ипрскра хммо, ХММ1 


127 63 0 127 63 0 





хммо 
Рис. 14.5. Схема работы команды ипрсера 


К командам распаковки данных можно отнести и команду зпи?ра, выполняю- 
щую перестановку 64-разрядных упакованных чисел с плавающей точкой двой- 
ной точности в соответствии с заданной маской. Команда имеет три операнда: 
входной, выходной и маску. Маска представляет собой 8-разрядное значение, за- 
дающее порядок перестановки операндов. Младшие 2 бита маски определяют но- 
мер упакованного 64-разрядного операнда в приемнике или источнике, который 
должен помещаться в операнд-приемник. При этом порядок размещения 64-раз- 
рядных операндов таков: нулевой (младший) бит маски указывает номер упако- 
ванного числа приемника, которое становится младшим упакованным значением 
результата, а первый бит — номер упакованного числа источника, которое стано- 
вится старшим упакованным значением результата. 

В качестве входного операнда (источника) могут выступать ХММ-регистр 
или 128-разрядная ячейка памяти. Выходным операндом может быть только 
ХММ-регистр. 

Должен заметить, что все перестановки выполняются одновременно, то есть 
параллельно. Лучше всего схему работы команды 5Пи?ра иллюстрирует рис. 14.6. 


Лира ХММО, ХММТ, 1Н 


127 
\2 


0 


| 


Маска: 18 = | 00 100100101 | 
Рис. 14.6. Схема работы команды $Пирд 


Как видно из рис. 14.6, младший (нулевой) бит маски равен 1, поэтому млад- 
ший операнд результата (регистр ХММО) будет содержать элемент Х1. Первый бит 
маски равен 0, поэтому старший элемент результата будет содержать У2. 
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Команда $Пи?ра имеет ценное практическое применение. Например, с ее помо- 
щью можно поместить одно и то же 64-разрядное число в старшую и младшую 
части 128-разрядного операнда. Листинг 14.8 демонстрирует это. 


Листинг 14.8. Использование команды $Нира 
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Программный код примера реализован в виде процедуры $Пи?р4_ех, прини- 
мающей в качестве параметра адрес 128-разрядного операнда. Процедура возвра- 
щает адрес 128-разрядного операнда, содержащего результат, в регистре ЕАХ. Сле- 
дующая команда программного кода процедуры помещает в оба 64-разрядных 
операнда регистра ХММ значение старшего операнда: 


зпитра ХММо. ХММо, ЗВ 
Это можно проиллюстрировать схемой, показанной на рис. 14.7. 
злифа ХММо, ХММО, ЗВ 
127 63 0 


До операции: 23.97 -14.05 хммо 
127 63 0 


После операции: 23.97 23.97 хммМо 


Маска: ЗВ = | 00100 | 001 11 | 


Рис. 14.7. Схема работы команды $Пи@а ХММО, ХММО, ЗВ 


Если оба 64-разрядных операнда должны содержать значение младшей части, 
то в команде $пиТра следует изменить значение маски с ЗВ на 01. 
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Для того чтобы поменять обе 64-разрядные части регистра ХММО местами, то 
есть старшую часть поместить на место младшей, а младшую — на место старшей, 
следует использовать команду 


зпиера ХММо. ХММо. 1 


Команды преобразования обеспечивают преобразование упакованных или ска- 
лярных чисел с плавающей точкой в коротком формате (ЗРЕР) или в двойном 
формате (ОРЕР) в формат целых чисел и наоборот. Данные в целочисленном 
формате могут быть 128-, 64- или 32-разрядными. К этой группе относятся сле- 
дующие команды: 


сУЕра2р1 — параллельное преобразование двух упакованных 64-разрядных 
чисел с плавающей точкой в двойном формате в два 32-разрядных целых 
числа со знаком. В качестве входного операнда (источника) может выступать 
один из ХММ-регистров, а в качестве выходного операнда — ММХ-регистр. 
Результат округляется в соответствии со значением битов поля гс регистра 
управления/состояния (МХС$В); 


сУИЕра2р1 — параллельное преобразование двух упакованных 64-разрядных 
чисел с плавающей точкой в двойном формате в два 32-разрядных целых 
числа со знаком. В качестве входного операнда (источника) может выступать 
один из ХММ-регистров, а в качестве выходного операнда — ММХ-регистр. 
Результат формируется путем отбрасывания дробной части числа, при 
этом регистр управления/состояния (МХС$В) не используется; 


с\{$42$1 — скалярное преобразование младшего упакованного 64-разряд- 
ного числа с плавающей точкой в двойном формате в 32-разрядное целое 
число со знаком. В качестве входного операнда (источника) может высту- 
пать один из ХММ-регистров, а в качестве выходного операнда — 32-раз- 
рядный регистр общего назначения. Результат округляется в соответствии 
со значением битов поля гс регистра управления/состояния (МХС5В); 


с\{Е$4251 — скалярное преобразование младшего упакованного 64-разряд- 
ного числа с плавающей точкой в двойном формате в 32-разрядное целое 
число со знаком. В качестве входного операнда (источника) может высту- 
пать один из ХММ-регистров, а в качестве выходного операнда — 32-раз- 
рядный регистр общего назначения. Результат формируется путем отбра- 
сывания дробной части числа, при этом регистр управления/состояния 
{МХС$К) не используется; 


с\ёр12р4 — параллельное преобразование двух упакованных 32-разрядных 
целых чисел в два упакованных 64-разрядных числа с плавающей точкой. 
В качестве операнда-источника может выступать ММХ-регистр, а в каче- 
стве операнда-приемника — ХММ-регистр; 


с\{$12$4 — скалярное преобразование 32-разрядного целого числа в упако- 
ванное 64-разрядное число с плавающей точкой. Результат помещается 
в младшую часть ХММ-регистра, не затрагивая старшей части. В качестве 
операнда-источника может выступать 32-разрядный регистр общего назна- 
чения, а в качестве операнда-приемника — ХММ-регистр. 
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Рассмотрим практические аспекты использования команд преобразования 
и начнем с команды с\уёра2р1. Следующий пример показывает, как можно преоб- 
разовать два упакованных 64-разрядных числа с плавающей точкой в двойном 
формате в 32-разрядные упакованные целые числа (листинг 14.9). Программный 
код примера реализован в виде процедуры _с\{р@2р1_ех, принимающей в качестве 
параметра адрес 128-разрядного операнда и возвращающей в регистре ЕАХ адрес 
области памяти гез, содержащей два 32-разрядных целых числа. 


Листинг 14.9. Преобразование чисел с плавающей точкой в двойном формате в целые числа 
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.Чата 
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ПОУЧ Чмога рёг гез. ММО 
Теа ЕАХ, гез 
рор ЕВР 
ге 
_суЕраёр1_ех епар 
ета 
Программный код процедуры несложен. Параметр (адрес 128-разрядной пере- 
менной), как обычно, передается через регистр ЕВР и загружается в ЕТ. Затем два 
64-разрядных операнда с плавающей точкой помещаются в регистр ХММ0 и выпол- 
няется их преобразование к целочисленному типу при помощи команды 


с\ёра2р1 ММО. ХММО 


Результат преобразования, сохраненный в ММХ-регистре ММО при помощи 
команды поуа, помещается в переменную гез. Адрес этой переменной помещается 
в регистр ЕАХ командой 


]Леа ЕАХ. гез 


После этого стек восстанавливается и происходит выход из процедуры. 

По умолчанию режимом округления, определяемым полем гс регистра управ- 
ления/состояния (МХС$В), является округление к ближайшему целому числу. 

Для проверки работоспособности процедуры можно использовать короткую 
программу на У\!5ца| С++ МЕТ (листинг 14.10). 


Листинг 14.10. Демонстрационная программа для процедуры из листинга 14.9 
ЯНпсТиде <$1910.1> 

ехфеги “С” 1п5* субраёр1_ех(аои1е* а1): 

11% тма1п(у01а) 
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{ 

__@ес15рес(а1191(16)) доие а1[2] = { -1956.54, 6720.47 }: 
11* р11 = суёра2р1_ех(а1); 

реТИЕР("СУТРО2РТ ехатр1е: \п"); 

риТИЕЕ("%а ". *р11++): 

репЕТ("%а\п”", *р11): 

гебигп 0: 


} 


При указанных значениях элементов массива а1 чисел с плавающей точкой 
двойной точности полученный результат будет выглядеть так: 


СМТРО2РТ ехатр1е: 
-1957 6720 


Следующий пример демонстрирует работу скалярной команды с\(1$4251. 
Напомню, что эта команда преобразует младшее 64-разрядное число с плаваю- 
щей точкой двойной точности ХММ-регистра в 32-разрядное целое число без 
дробной части, которое помещается в один из 32-разрядных регистров общего на- 
значения. Программный код примера реализован в виде процедуры _с\1{54251_ех 
(листинг 14.11). Процедура преобразует элементы массива чисел с плавающей 
точкой двойной точности в 32-разрядные целые числа. В качестве параметров 
процедура принимает (слева направо) адрес исходного массива и размер массива 
в байтах. Процедура возвращает адрес массива гез целых чисел в регистре ЕАХ. 
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Параметры в процедуру передаются через регистр ЕВР, при этом адрес исходного 
массива помещается в регистр Е$1, а размер этого массива (в байтах) — в регистр 
ЕСХ. Далее размер в байтах преобразуется к количеству учетверенных (64-разряд- 
ных) слов при помощи команды 


$Иг ЕСХ. 3 


Адрес массива гез, где будет находиться результат преобразования, загружает- 
ся в регистр Ей1. 

Все последующие вычисления выполняются в цикле пех", счетчик которого 
находится в регистре ЕСХ. Первая команда цикла помещает 64-разрядный операнд 
в младшую часть регистра ХММ0: 


моу$а ХММО. [Е$Г] 
Собственно преобразование выполняет команда 
су $92$1 ЕАХ. ХММО 


Эта команда помещает 32-разрядный целочисленный результат в регистр ЕАХ 
{можно использовать и другой 32-разрядный регистр общего назначения). Сле- 
дующие две команды продвигают указатели адресов исходного и результирую- 
щего массивов к следующим элементам: 


а49 ЕЗ1. 8 
а4а ЕОТ. 4 


Здесь необходимо учитывать то, что следующий 64-разрядный элемент исход- 
ного массива, адресуемый регистром ЕЗ1, имеет смещение 8 по отношению к теку- 
щему, а следующий элемент целочисленного массива гез (адресуется регистром 
ЕОГ) — смещение 4. 

После окончания цикла адрес массива с результатами вычислений помещается 
в регистр ЕАХ, после чего стек восстанавливается и происходит выход из процедуры. 

На результат преобразования не влияет содержимое поля гс регистра управ- 
ления/состояния (МХС$В). Проверить работу процедуры _с\ {$4251 можно с помо- 
щью программы на \15иа] С++ .МЕТ (листинг 14.12). 


Листинг 14.12. Демонстрационная программа для процедуры из листинга 14.11 
истиае «$410. 1> ° 

ехфегп "С" 1тё* су $92$1_ех(доиБТе* а1. 1пё а$12е); 

116 та1п(\014) 


{ 

__9ес1$рес(а119п(16)) доче а1[5] = { 
-16.54.72.47. -3774.03.45.98. -65.51 }; 

11 а$17е = $17е01(а1); 

116* р11 = с\{Е$92$1_ех(а1. а$1те): 

ретиЕЕ("СУТТ$02$1 ехатр1е: \п”); 

Фог (11 11 = 0:11 < а$12е / 8: 11++) 


рии ЕР ("$4 ". *р12++); 


гебигп 0: 


} 
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При указанных значениях элементов массива а1 чисел с плавающей точкой 
двойной точности полученный результат будет выглядеть так: 


СУТТ$02$Т ехатр1е: 
-16 72 -3774 45 -65 


Последний пример применения команд преобразования, который мы рас- 
смотрим, связан с изменением режима округления. Предположим, что в процессе 
преобразования 64-разрядных чисел с плавающей точкой двойного формата в це- 
лочисленное значение требуется округлять результат к ближайшему большему 
числу. В этом случае перед выполнением операции преобразования следует уста- 
новить биты поля гс регистра управления/состояния (МХС$К) в 10. Модифициру- 
ем исходный текст представленной в листинге 14.9 процедуры _с\р92р1_ех так, 
чтобы округление выполнялось в большую сторону. Назовем новую процедуру 
_суёра2р1_еха{ (листинг 14.13). 


Листинг 14.13. Округление числа с плавающей точкой в сторону большего целого числа 
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Я не буду анализировать весь программный код процедуры, поскольку подоб- 
ный код мы уже рассматривали. Остановлюсь лишь на изменениях. Для того что- 
бы установить режим округления к большему числу, в программный код проце- 
дуры добавлены три команды: 

$4тхсзг  $Фафе МХС$К 


ог мога рёг зтафе МХС$В. 40001 
14тхсзг зФафе МХС$В 


Первая из этих команд сохраняет состояние регистра МХС$В в переменной 
фафе_МхХС$К. Все значащие биты состояния находятся в младшем слове, в частности 
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поле гс определяется битами 13-14. Для установки режима округления в боль- 
шую сторону (гс = 10) выполняется команда 


ог ога рёг збафе МХС$В. 40008 


После этого содержимое переменной ${а{е_МХС$В записывается обратно в ре- 
гистр МХС$К командой 


]атхс$г зфафе_МХС$В 


Эти команды следует выполнить перед операцией преобразования, чтобы из- 
менения возымели эффект. 

Если запустить тестирующую программу, то результатом преобразования чи- 
сел с плавающей точкой двойной точности (—1956,54 и 6720,47) будут целые чис- 
ла (-1956 и 6721). 

Логические команды выполняют поразрядные операции над упакованными 
операндами: 


® апара — поразрядное логическое И над двумя операндами, каждый из кото- 
рых представляет собой 128-разрядное значение. В качестве входного опе- 
ранда (источника) могут выступать ХММ-регистр или 128-разрядная ячейка 
памяти, а в качестве выходного — ХММ-регистр; 


® апдпр@ — инвертирует содержимое операнда-приемника, после чего выпол- 
няет операцию поразрядного логического И над двумя операндами, каждый 
из которых представляет собой 128-разрядное значение. В качестве вход- 
ного операнда (источника) могут выступать ХММ-регистр или 128-разряд- 
ная ячейка памяти, а в качестве выходного — ХММ-регистр; 


® огра — поразрядное логическое ИЛИ над двумя операндами, каждый из ко- 
торых представляет собой 128-разрядное значение. В качестве входного 
операнда (источника) могут выступать ХММ-регистр или 128-разрядная 
ячейка памяти, а в качестве выходного — ХММ-регистр; 


® хогра — поразрядное логическое исключающее ИЛИ над двумя операнда- 
ми, каждый из которых представляет собой 128-разрядное значение. В ка- 
честве входного операнда (источника) могут выступать ХММ-регистр или 
128-разрядная ячейка памяти, а в качестве выходного — ХММ-регистр. 


Логические команды можно использовать для вычисления абсолютной вели- 
чины (модуля) числа и изменения знака числа. Приведу два примера такого при- 
менения логических команд. 

Для вычисления абсолютной величины упакованных 64-разрядных чисел с пла- 
вающей точкой двойной точности можно воспользоваться процедурой аБ5_ех, 
принимающей в качестве единственного параметра адрес 128-разрядного операн- 
да, а возвращающей в регистре ЕАХ адрес области памяти, содержащей результат 
(листинг 14.14). 

Остановлюсь на программном коде процедуры более подробно. Как известно, 
знак числа определяется его старшим разрядом. Если число положительно, то 
старший или, как его называют, знаковый бит равен 0. Знаковый бит отрицатель- 
ного числа равен 1. Для получения абсолютной величины числа нужно обнулить его 
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знаковый бит, не затрагивая остальные, тогда, независимо от знака исходного числа, 
результат всегда будет положительным. Это можно сделать при помощи операции 
логического И, в которой первым операндом выступает исходное число, а вто- 
рым — двоичная маска, имеющая в старшем разряде 0, а в остальных — 1. 


Листинг 14.14. Вычисление абсолютных значений чисел с плавающей точкой 
двойной точности 
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Для 128-разрядного операнда, состоящего из двух упакованных 64-разрядных 
чисел с плавающей точкой, биты 127 и 63 содержат знак числа, поэтому в проце- 
дуре задана область памяти с меткой тзк, представляющая собой 128-разрядное 
число с нулями в 127-м и 63-м битах. Для простоты область памяти тк представ- 
лена как два 64-разрядных числа — тзК_П19Н и м$К_10м. 

В этой процедуре 128-разрядный операнд, адресуемый регистром ЕЗТ, помеща- 
ется в регистр ХММ0 с помощью команды 


тоуира ХММО. [ЕЗТ] 
Маска тзК помещается в регистр ХММ1 при помощи команды 
тоуира ХММ1. [Е0Т] 


После этого абсолютное значение двух упакованных 64-разрядных операндов 
вычисляет команда 


апара ХММ. ХММ] 


Далее результат помещается в переменную гез, и процедура возвращает ее ад- 
рес в регистре ЕАХ. 
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В следующем примере я продемонстрирую, как можно поменять знак упако- 
ванного 64-разрядного операнда на противоположный. Для этого можно исполь- 
зовать процедуру 519п_ех, принимающую в качестве входного параметра 128-раз- 
рядный операнд, а возвращающую в регистре ЕАХ адрес памяти, где содержатся 
числа со знаком, противоположным знаку исходного операнда (листинг 14.15). 


Листинг 14.15. Изменение знака упакованного 64-разрядного числа 
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Проанализируем программный код процедуры. Из предыдущего примера по- 
нятно, как определяется знак числа. Для того чтобы изменить знак числа на про- 
тивоположный, нужно выполнить операцию исключающего ИЛИ, в которой пер- 
вым операндом выступает исходное число, а вторым — двоичная маска, имеющая 
в старшем разряде 1, а в остальных разрядах — 0. 

Область памяти т5к процедуры $19п_ех содержит 128-разрядное значение, со- 
держащее единицы в 127-м и 63-м разрядах. Разделение 128-разрядного значения 
на две переменные, п5К_П19й и п5К_1ом, делает принцип работы процедуры более 
понятным. | 

128-разрядный операнд, адресуемый регистром ЕЗТ, помещается в регистр ХММ0 
с помощью команды 


тоуира ХММО. ГЕЗТ] 
Маска пзК помещается в регистр ХММ1 при помощи команды 
тоуира ХММ1. Г[ЕОТ] 


После этого знаки двух упакованных 64-разрядных операндов изменяет ко- 
манда 
хогра ХММО. ХММ1 
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Далее результат помещается в переменную гез, и процедура возвращает ее ад- 
рес в регистре ЕАХ. 

В следующую группу команд входят команды управления состоянием вы- 
числений (19тхсзг, 5тхсзг, Гхзаме, Рхг5бог), которые были рассмотрены нами ра- 
нее в главе 13 при анализе 55Е-расширения, а также команды управления кэши- 
рованием (с11и$й, 1Тепсе, тепсе). 

Назначение команд кэширования данных состоит в том, чтобы оптимизиро- 
вать использование кэша данных при интенсивных вычислениях. Команда с1 151 
обеспечивает установку признака обратной записи (у\угке-БасК) неупорядоченных 
данных, что повышает производительность операций. 

Команды 1Тепсе и тРепсе выполняют следующие функции: 


® записывают некэшированные данные как полные строки в кэш данных; 


® считывают некэшированные данные как полные строки, так, как если бы 
они находились в кэше данных. 


14.2. Команды обработки 128-разрядных 
целочисленных данных 


Помимо повышения эффективности обработки 128-разрядных упакованных 
данных с плавающей точкой двойной точности, 33Е2-расширения повышают 
эффективность выполнения целочисленных операций. Многие ММХ-команды 
целочисленного расширения были модифицированы таким образом, чтобы опе- 
рировать 128-разрядными значениями. Команды 128-разрядного целочисленного 
расширения имеют те же мнемонические обозначения, что и ММХ-команды, 
но при работе с данными большей чем 64 бита разрядности добавляется суф- 
фикс. Команды для обработки 128-разрядных целых чисел позволяют повы- 
сить производительность выполнения приложений, в которых они использу- 
ются, поскольку обрабатывают параллельно в два раза больше данных, чем 
ММХ-команды. 

Мнемоники операций в командах 128-разрядного целочисленного расшире- 
ния остались теми же, что и в случае ММХ. Компилятор определяет тип команды 
(версия для 64 или 128 бит) по типу регистров, используемых в качестве опе- 
рандов. 

Объясню это на примере. Предположим, что команда ММХ-расширения 
имеет вид 


команда тт0. тт] 


В этом случае компилятор обрабатывает команду как имеющую ММХ-фор- 
мат. Еще пример: 


команда хтт0. хтт1 


Такую команду компилятор транслирует как имеющую 128-разрядный цело- 
численный формат $5Е2. 
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Дополнительные инструкции 128-разрядного целочисленного расширения 
имеют в мнемонических обозначениях следующие символы: 


префикс р означает, что выполняется параллельная операция над элемен- 
тами упакованных данных; 


суффиксы Б, м, 4, 9, 94 указывают на тин данных (байт, слово, двойное сло- 
во, учетверенное слово или двойное учетверенное слово); 


суффиксы 5 или и говорят о том, что операция выполняется со знаковыми 
($1епе4) или беззнаковыми (ипяпей) значениями. 


Например, обозначение команды рти1и04 указывает на то, что выполняется 
операция умножения упакованных беззнаковых 16-байтовых (ФоцЫе-диад\ог) 
операндов. Рассмотрим более подробно команды 128-разрядного целочисленного 
расширения и начнем с команд пересылки данных. 

В группу команд пересылки данных входят следующие команды: 


тоу9294 — пересылка 64-разрядного операнда из ММХ-регистра в ХММ-ре- 
гистр. Старшие 64 бита ХММ-регистра заполняются нулями; 


поу4424 — пересылка младшей части 128-разрядного операнда из ХММ-ре- 
гистра в ММХ-регистр; 


поудча — пересылка 128-разрядных операндов. В качестве входного операн- 
да (источника) могут выступать ХММ-регистр или 128-разрядная ячейка 
намяти. Выходным операндом должен быть ХММ-регистр. Данные долж- 
ны быть выровнены по 16-байтовой границе, в противном случае возника- 
ет исключение общей защиты; 


тоудди — пересылка 128-разрядных операндов. В качестве входного операн- 
да (источника) могут выступать ХММ-регистр или 128-разрядная ячейка 
памяти. Выходным операндом должен быть ХММ-регистр. Выравнивание 
данных по 16-байтовой границе необязательно. 


К группе арифметических относятся следующие команды: 


радаь — сложение упакованных байтов операнда-источника и операнда-при- 
емника. Результат помещается в операнд-приемник, в качестве которого 
выступает ХММ-регистр. В качестве операнда-источника могут выступать 
либо ХММ-регистр, либо ячейка памяти; 


ра4ам — сложение упакованных слов операнда-источника и операнда-при- 
емника. Результат помещается в операнд-приемник, в качестве которого 
выступает ХММ-регистр. В качестве операнда-источника могут выступать 
либо ХММ-регистр, либо ячейка памяти; 


рад4а — сложение упакованных двойных слов операнда-источника и опе- 
ранда-приемника. Результат помещается в операнд-приемник, в качестве 
которого выступает ХММ-регистр. В качестве операнда-источника могут 
выступать либо ХММ-регистр, либо ячейка памяти; 


ра94а — сложение упакованных учетверенных слов операнда-источника 
и операнда-приемника. Команда имеет две модификации: одна работает 
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с ММХ-регистрами, другая — с ХММ-регистрами. Результат помещается 
в операнд-приемник, в качестве которого выступает либо ММХ-регистр, 
либо один из ХММ-регистров. В качестве операнда-источника могут вы- 
ступать ММХ-регистр, ХММ-регистр или ячейка памяти; 


® р5зиБЬ — вычитание упакованных байтов операнда-источника из операн- 
да-приемника. Результат помещается в операнд-приемник, в качестве ко- 
торого выступает ХММ-регистр. В качестве операнда-источника могут 
выступать либо ХММ-регистр, либо ячейка памяти; 


® р5\уби — вычитание упакованных слов операнда-источника из операнда-при- 
емника. Результат помещается в операнд-приемник, в качестве которого 
выступает ХММ-регистр. В качестве операнда-источника могут выступать 
либо ХММ-регистр, либо ячейка памяти; 


® р5\59 — вычитание упакованных двойных слов операнда-источника из опе- 
ранда-приемника. Результат помещается в операнд-приемник, в качестве 
которого выступает ХММ-регистр. В качестве операнда-источника могут 
выступать либо ХММ-регистр, либо ячейка памяти; 


® р5иба — вычитание упакованных учетверенных слов операнда-источника 
из операнда-приемника. Команда имеет две модификации: одна работает 
с ММХ-регистрами, другая — с ХММ-регистрами, Результат помещается 
в операнд-приемник, в качестве которого выступает либо ММХ-регистр, 
либо один из ХММ-регистров. В качестве операнда-источника могут вы- 
ступать ММХ- регистр, ХММ-регистр или ячейка памяти; 


® риЛИи — параллельное умножение упакованных слов операнда-источника 
и операнда-приемника. Старшие части произведений помещаются в опе- 
ранд-приемник, в качестве которого может выступать один из ХММ-реги- 
стров. Входным операндом, или источником, могут служить ХММ-регистр 
или 128-разрядная ячейка памяти; 


® рты — умножение упакованных слов операнда-источника и операнда- 
приемника. Младшие части произведений помещаются в операнд-при- 
емник, в качестве которого может выступать один из ХММ-регистров. 
Входным операндом, или источником, могут служить ХММ-регистр или 
128-разрядная ячейка памяти; 


® рт1и04 — умножение младших 32-разрядных целых чисел из 64-разрядных 
операндов источника и приемника. Результат умножения является 64-раз- 
рядной переменной целого типа. В качестве входного операнда могут вы- 
ступать ХММ-регистр или ячейка памяти, в качестве выходного — только 
ХММ-регистр. 


Рассмотрим пример применения арифметических операций для обработки 
128-разрядных целочисленных данных. Здесь будут продемонстрированы выпол- 
нение различных команд 128-разрядного 55Е2-расширения и техника совместно- 
го использования ММХ- и 53Е2-регистров. 

Предположим, есть два массива 32-разрядных целых чисел (назовем их а, иб,) 
и требуется вычислить выражение (а, — 6.) х (а, + 6,) для каждой пары элементов 
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массивов. Для вычисления значения этого выражения воспользуемся командами 
рада, рзиБЧ и рти1 ад, а также продемонстрируем работу команд пересылки. Про- 
граммный код, выполняющий вычисления, реализован в виде процедуры 111 128_детю 
(листинг 14.16). Процедура принимает в качестве операндов адреса целочис- 
ленных массивов а! и 5, и размер массивов в байтах, а в регистре ЕАХ возвращает 
адрес массива, где хранится результат. Мнемоническое обозначение процедуры 
выглядит так: 


116128_дето(ад9гез$_а1. а4@гез$_Ь1. $12е) 


Листинг 14.16. Применение целочисленных 128-разрядных команд 


.686 
„тет ГТаф 
„ХММ 
ор Топ сазетар: попе 
„Фата 
гез 00 3 01Р(0) 
.соде 
11128 _@ето ргос 
ри$в ЕВР 
ЮУ ЕВР. ЕЗР 
оу ЕЗГ. @мога рёг ГЕВР+8] 
оу ЕОТ. дога рёг [ЕВР+12] 


Теа ЕВХ, гез 
Ще ЕСХ, @мога руг [ЕВР+16] 
$Иг ЕСХ. 2 
пехф: 
тоуа ММО. @мога рёг [ЕЗТ] : а1 -> ММО (ом 32 51%) 
тоуд29а ХММо, ММО ; а1 -> ХММО (10м 32 51%) 
тоудди  ХММ2. ХММО : зауе ХММО 1пт ХММё 
моуд ММО, Чмога р\г [Е97]°; Ы -> ММ 
моуа29а ХММ. ММО : Ы -> ХММ (ом 32 516) 
рзиБа ХММО. ХММ1 : а1-61 -> ХММ 
рада ХММ2. ХММ] : а1+61 -> ХММё 
рт Лида ХММо. ХММ2 $ (а1-61)ж(а1+61) -> ХММО 


тоуЧага ММО. ХММО 
моуа [ЕВХ]. ММО 


а94 ЕЗТ, 4 
ааа ЕО. 4 
ада ЕВХ. 8 
Чес ЕСХ 
дп: пех 
рор ЕВР 
Теа ЕАХ. гез 
ге 
11128 ето епар 
ета 


Работа процедуры начинается с загрузки адресов массивов при помощи ко- 
манд 
ЮУ ЕЗТ, ога рёг [ЕВР+8] 


Де ЕОГ. @мога рёг [ЕВР+12] 
1Теа ЕВХ. гез 
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Для большей определенности положим, что регистр Е$1 содержит адрес масси- 
ва а,, регистр Еб1 — адрес массива 5, и ЕВХ — адрес массива ге, где будет сохранен 
результат. Массив гез в нашем слу%е содержит четыре 32-разрядных элемента 
суммарным размером в учетверенное слово (8 байт), хотя можно выбрать и дру- 
гой размер. Элементы массива гез представляют собой произведение 32-разряд- 
ных операндов, и для каждого из них резервируется 64-разрядная ячейка памяти. 
Следующие команды помещают в регистр ЕСХ количество двойных слов массивов 
а! и 6, (размеры массивов предполагаются одинаковыми): 


тоу ЕСХ. Чюга рег [ЕВР+16] 
иг ЕСХ. 2 


Затем в цикле пехё осуществляется вычисление выражения для каждой пары 
элементов массивов а; и В.. В каждой итерации цикла выполняются следующие 
действия: 


1. В младшее двойное слово ММХ-регистра ММ0 помещается 32-разрядное це- 
лое число из массива а. Для этого служит команда 
поу@ ММО. дога рёг ГЕЗГ] 


2. Чтобы можно было использовать команды 128-разрядной арифметики, 
32-разрядный операнд из регистра ММ0 помещается в регистр ХММО ко- 
мандой 


тоу244 ХММО. ММО 
При этом старшие разряды регистра ХММ0 заполняются нулями. 


3. Содержимое регистра ХММ0 для последующего использования копируется 
в регистр ХММ2 командой 


тоудаи ХММ2. ХММО 


4. В младшее двойное слово ММХ-регистра ММО помещается 32-разрядное це- 
лое число из массива 5, командой 


тоу@ ММО. Чмог@ рёг ГЕОТ] 
5. 32-разрядный операнд из регистра ММО помещается в регистр ХММО командой 
моуд2аа ХММ1. ММО 
6. Вычисляется разность а! — 5:. Для этого используется команда 
рзиБа ХММо. ХММ1 
Результат сохраняется в регистре ХММО. 
7. Вычисляется сумма а, + В. Для этого используется команда 
радда хмм, хмм1 
Результат сохраняется в регистре ХММ2. 
8. Значение выражения (а, - 5,) х (а, + Ь,) вычисляется при помощи команды 
рти1ида ХММО. ХММ2 
При этом результат сохраняется в регистре ХММ0. 
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9. Полученный результат сохраняется в соответствующем элементе массива 
гез с помощью команд 
тоуда2а ММО. ХММо 
поуа  [ЕВХ]. ММО 
По завершении всех итераций адрес массива гез помещается в регистр ЕАХ, по- 
сле чего происходит выход из процедуры. 
Работоспособность процедуры легко проверить при помощи программы на 
\15иа! С++ МЕТ (листинг 14.17). 


Листинг 14.17. Демонстрационная программа для процедуры из листинга 14.16 
Аис1иде <${910.и> 

ехёегп “С" 1019 10п9* 1п{128_дето(1пе* а1. 1пЕ* а2, Чи а517е); 

1пе ма1п(у01а) 


118 а1[3] = { 1259. 954, -6451 }; 

11 а2[3] = { -2901, -419, 4202 }; 

116 а$12е = $12е01(а1): 

1019 10п9* р1] = 114128 дето(а1. а2, а$12е): 
риЧиЕЕ(" [МТ -128 ОЕМО гези1{$:\п"); 

Тог (17 11 =0: 11 < аз17е / 4: 11++) 


{ 
ргтиЕР ("#9 ”. *р11++): 
} 


гебигп 0: 
} 

В этой программе процедура 1и1128_дето должна быть объявлена с директивой 
ехеегп. Обратите внимание на то, что процедура оперирует целочисленными зна- 
чениями (тип 111), имеющими разрядность 32 бита, в то время как произведения 
(а - В) х (а, +61) имеют 64-разрядную разрядность. По этой причине выходное 
значение (адрес массива), возвращаемое процедурой, объявлено как имеющее 
тип 1019 10п9*. 

33Е2-расширение включает новые команды сдвига целочисленных операндов: 

® р51194 — сдвиг влево содержимого ХММ-регистра (операнд-приемник) 

на указанное вторым операндом количество байтов. Второй операнд явля- 
ется непосредственным значением. Обратите внимание на то, что сдвиг 
осуществляется не на биты, а на байты. Схема работы команды р51194 пока- 
зана на рис. 14.8; 


рз!4а ХММО, 8 
127 63 0' 


Сдвиг влево на 8 байт 


фо 
После операции: 00...00 | 00...00 | хммо 


Рис. 14.8. Схема работы команды р$!4а ХММО, 8 
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® р5г194 — сдвиг влево содержимого ХММ-регистра (операнд-приемник) на 
указанное вторым операндом количество байтов. Второй операнд являет- 
ся непосредственным значением. Обратите внимание на то, что сдвиг осу- 
ществляется не на биты, а на байты. Схема работы команды р$г144 показана 
на рис. 14.9. 


рзиач ХММО, 12 
127 63 0 


Сдвиг влвво на 12 байт 


РИ 
После операции: | 00..00 | 00.00 | 00.00 хмм 


Рис. 14.9. Схема работы команды рз!д4 ХММО, 12 


$5Е2-расширение включает новые команды перестановки целочисленных 
операндов: 

® р5ПиГа — перестановка и сохранение четырех 32-разрядных элементов опе- 
ранда-источника, представляющего собой ХММ-регистр или ячейку па- 
мяти, в операнд-приемник, в качестве которого выступает ХММ-регистр. 
Порядок перестановки определяется 8-разрядной маской, являющейся 
третьим операндом. Содержимое операнда-источника при этом не изменя- 
ется. Схема работы команды р5Пи{4 показана на рис. 14.10; 


рэпа ХММО, ХММ, ЭСВ 


До операции: 
127 63 


После операции: 
127 63 


Маска: ЭСН = | 10101 | 11100 | 
Рис. 14.10. Схема работы команды р5пу ХММО, ХММ1, 9СК 


® рэпии — перестановка и сохранение младших слов операнда-источника, 
представляющего собой ХММ-регистр или ячейку памяти, в операнд-при- 
емник, в качестве которого выступает ХММ-регистр. Порядок перестановки 
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определяется 8-разрядной маской, являющейся третьим операндом. Содер- 
жимое операнда-источника при этом не изменяется. Схема работы коман- 


ды рэпи м показана на рис. 14.11; 


реКийми ХММО, ХММЛ, ЭСЬ 


До отерации 
127 47 31 150 
[вам] жж 
127 63 31 0 


[м 


После раии 
127 47___ 3115 0 


ео [мм [в ао 


Маска: ЭСН = | 10 | 01 [11 | 00 | 
Рис. 14.11. Схема работы команды р$Пийм! ХММО, ХММ1, 9СП 


р$пи пм — перестановка и сохранение старших слов операнда-источника, 
представляющего собой ХММ-регистр или ячейку памяти, в операнд-при- 
емник, в качестве которого выступает ХММ-регистр. Порядок перестановки 
определяется 8-разрядной маской, являющейся третьим операндом. Содер- 
жимое операнда-источника при этом не изменяется. Схема работы коман- 


ды рэПи!йм показана на рис. 14.12. 


рэпу ми ХММО, ХММЛ, ЭС 
До пери 
127 111 95 79 


реа. и 


127 111 


Ге У р 


После операции: 
127 111 79 63 


Г] мии 


3 _ 


Маска: ЭСН = | 10 | 01 | 11 | 00 | 
Рис, 14.12. Схема работы команды р5Пийм! ХММО, ХММ1, 9СИ 
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Рассмотрим использование команд перестановки на следующем примере. Пред- 
положим, имеется массив целых чисел а!, содержащий элементы х\, Хо, Хз, ... И. 
Требуется изменить порядок следования операндов в массиве на обратный, то 
есть первым элементом массива должен быть хи, вторым — хп_, и, наконец, по- 
следним элементом — х!. Программный код, реализующий этот алгоритм, пред- 
ставлен в виде'‘демонстрационной процедуры (назовем ее _рзНи?_1И_ех) в лис- 

тинге 14.18. 


Листинг 14.18. Изменение порядка следования элементов массива 


. 686 
„тюде1 Та& 
„ХММ 
ор1оп сазетар:попе 
. дата 
гез М 8 ПР (0) 
.соде 
_ряпит 1и_ех ргос 
ризН ЕВР 


оу ЕВР. ЕЗР 

оу ЕЗГ. дога рег [ЕВР+8] 
Теа ЕОГ. ге 
моудди ХММО. [Е$Т] 
р$1199 ХММо. 8 

тмоудди ХММ1. [Е$1] 
р$г1аа ХММ, 8 

ради ХММ. ХММО 
реви м ХММ1. ХММ1, 188 
репиим ХММ1. ХММ1. 1Вп 
моудди ГЕ0Г]. ХММ1 


рор ЕВР 
1еа ЕАХ. гез 
геё 
_рупи? Лн_ех епар 
ета 


Проанализируем программный код процедуры. В качестве входного парамет- 
ра процедура принимает адрес массива 16-разрядных чисел, который помещается 
в регистр Е$1. В регистре ЕАХ процедура возвращает адрес массива гез, в котором 
будет храниться результат перестановки элементов исходного массива. 

Предположим для упрощения, что исходный массив (массив а!) содержит 
целочисленные значения ж-х„, показанные на рис. 14.13. 


Массив а1 из 8 элементов 


х2 х3 2х4 ›х5 хб хХ7 


Рис. 14.13. Содержимое элементов массива а; 


128-разрядный элемент массива а, в регистр ХММ0 помещает команда 
поу@аи ХММО, [Е5Т] 
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Замечу, что эта команда не требует выравнивания адреса операнда по 16-бай- 
товой границе. Следующая за ней команда выполняет сдвиг содержимого регист- 
ра ХММ0 на 8 байт влево: 

р$11аа хммо. 8 


После выполнения этой операции регистр ХММО будет содержать значение, по- 
казанное на рис. 14.14. 


127 111 95 79 63 0 





Рис. 14.14. Содержимое регистра ХММО после выполнения команды ра 


Далее воспользумся регистром ХММ1. После того как будут выполнены следую- 
щие команды, регистр ХММ1 будет содержать значение, показанное на рис. 14.15: 


моу@ди ХММ. [Е$1] 
р$г19а ХММ1, 8 


ХММ 





Рис. 14.15. Содержимое регистра ХММ1 после выполнения команды р$!44 


Затем выполняем операцию сложения упакованных целых чисел командой 
рада ХММ1, ХММО 


Содержимое регистра-приемника ХММ! после этой операции будет таким, как 
показано на рис. 14.16. 


127 63 47 31 150 





[3 с. хмм 


Рис, 14.16. Содержимое регистра ХММ! после выполнения команды радд\ 


Как видно из рис. 14.16, старшие 4 слова регистра ХММ] содержат младшие сло- 
ва массива а,, а младшие 4 слова регистра — старшие слова а!. Следующие две ко- 
манды располагают элементы регистра ХММ1 в нужном порядке: 


рзпи]м ХММ1. ХММ. 188 
руПиАм ХММ]. ХММ1. 188 


Рисунок 14.17 иллюстрирует работу одной из этих команд: 
репи Тм ХММ]. ХММ1. 188 


После выполнения этих двух команд в регистре ХММ] будет находиться после- 
довательность чисел, представленная рис. 14.18. 

К этому моменту регистр ХММ1 содержит элементы массива а, расположенные 
в обратном порядке. Теперь остается сохранить результат в массиве гез (команда 
тоуади [Е0Т). ХММ1) и передать адрес этого массива в вызывающую программу (ко- 
манда Теа ЕАХ, гез). 
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рэпийм ХММ1, ХММ1, 1ВВ 


До операции: 
63 15 0 


. 47 
[| о 


После ии 
63 47 15 0 


ий, 


Маска: 1ВН = | 00] 01 | 10 | 11 | 
Рис. 14.17. Содержимое регистра ХММ! после выполнения команды рзПийм 


127 


ГГ ГГ Г жим 


Рис. 14.18. Содержимое регистра ХММ1 после выполнения всех преобразований 


Работоспособность процедуры легко проверить при помощи программы на 
\У!51а! С++ МЕТ (листинг 14.19). 


Листинг 14.19. Демонстрационная программа для процедуры иэ листинга 14.18 


ЯНисТиае <$910.Н> 
ехёегпт "С" $погЕ 1пё* рупиР 1И_ех($Ноге 1п%* а1); 
118 ма1п(у0та) 


__@ес1$рес(а1191(16)) зПогё 1пё а1[8] = { 0. 1. 2. 3. 4. 5, 6. 7 }: 
ЗпогЕ 1п6* ра1 = рзНи?_1и_ех(а1); 

рге1пЕ("РУНИЕНИ РУНУРЫМ ехатр1е:\п"): 

Фог (1 11 =0: 11 <В; 11++) 


реЧиЕТ ("4 ". *ра1++); 
} 


гебиги 0: 


} 


В этой программе а1 — массив 16-разрядных целых чисел со знаком ($ПогЕ 111). 
Процедура рэНит_1Н_ех объявлена с директивой ехёегп и в качестве параметра 
принимает указатель на массив 16-разрядных целых чисел ($Ног{ 1п1{*), а возвра- 
щает адрес массива, в котором хранятся результаты ($Пог* 1п{*). Программа вы- 
водит на экран такой результат: 


РУНУРНИ РУНУРЫМ ехатр1Те: 
76543210 


К группе команд распаковки относятся команды, которые мнемонически 
можно обозначить как рипрскИ и рипрск1. С помощью этих команд проводится рас- 
паковка и перестановка старших (младших) частей операнда-источника и опе- 
ранда-приемника. При этом младшие (старшие) части операндов игнорируются. 
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В качестве операндов-источников могут выступать ХММ-регистры или 128-раз- 
рядные ячейки памяти, в качестве операндов-приемников — только ХММ-реги- 
стры. К этим командам относятся: 


рипрскнЬм — распаковка старших байтов операнда-источника и операнда-при- 
емника в старшие и младшие байты слов операнда-приемника соответст- 
венно; 


рипрск1Ьм — распаковка младших байтов операнда-источника и операнда-при- 
емника в старшие и младшие байты слов операнда-приемника соответст- 
венно; 


рипрскНиа — распаковка старших слов операнда-источника и операнда-при- 
емника в старшие и младшие слова двойных слов операнда-приемника со- 
ответственно; 


рипрск1ма — распаковка младших слов операнда-источника и операнда-при- 
емника в старшие и младшие слова двойных слов операнда-приемника со- 
ответственно; 


рипрскНад — распаковка старших двойных слов операнда-источника и опе- 
ранда-приемника в старшие и младшие двойные слова учетверенных слов 
операнда-приемника соответственно; 


рипрск1 44 — распаковка младших двойных слов операнда-источника и опе- 
ранда-приемника в старшие и младшие двойные слова учетверенных слов 
операнда-приемника соответственно; 


рипрскйада — распаковка старших учетверенных слов операнда-источника 
и операнда-приемника в старшие и младшие учетверенные слова двойных 
учетверенных слов операнда-приемника соответственно; 


рипрск1499 — распаковка младших учетверенных слов операнда-источника 
и операнда-приемника в старшие и младшие учетверенные слова двойных 
учетверенных слов операнда-приемника соответственно. 


‚Наэтом рассмотрение $3Е2-расширения можно закончить. Мы познакомились 
с большинством команд и способами их применения в программах на ассемблере, 
хотя эта тема очень обширна и ей посвящены многочисленные публикации. 
Основным источником информации по этим вопросам является документация 
фирмы Пие в которой технология $3Е2 описывается более подробно. 


Заключение 


Прогресс в индустрии высокопроизводительных процессоров столь стремите- 
лен, что новые технологии появляются до того, как устаревают старые. Линейка 
процессоров ие РепНит 4 совсем недавно пополнилась новыми устройства- 
ми — были выпущены семь новых процессоров, среди которых четыре предста- 
вителя с новой микроархитектурой ядра (Ргезсой) и кэшем 2-го уровня разме- 
ром в 1 Мбайт. 

Все эти процессоры рассчитаны на шину с частотой 800 МГц и поддерживают 
гиперпотоковую (Бурег-(Вгеа1п5) технологию. Кроме того, фирма пе! выпусти- 
ла Репииш 4 на ядре Ргезсой с частотой 2,8 ГГц, как и предыдущий изготовлен- 
ный по 90-нанометровой технологии, но рассчитанный на частоту 533 МГц и не 
поддерживающий гиперпотоковую технологию. По информации 1шЕе|, предназна- 
чен этот процессор специально для производителей комплексного оборудования. 

Но самым важным, с точки зрения программиста, было то, что в новом ядре 
Ргезсой. появилось очередное расширение, получившее название 5ЗЕЗ и содер- 
жащее 13 новых команд. Все они, за исключением трех, используют $ЗЕ-регистры 
и предназначены для повышения производительности при выполнении следую- 
щих операций: 


» быстрое преобразование вещественного числа в целое (соответствующая 
команда 115 1р заменяет семь «обычных» команд); 


® сложные арифметические вычисления (команды а@4зи6рз, адазиБра, том$14ир, 
тоу$Наир, тоудаир); 


® кодирование видео (команда 1344и); 
» обработка графики (команды Падрз, ИзиБрз, падара, изиБра); 
® синхронизация потоков (команды топ1%ог, тма11). 


Детальное рассмотрение новых команд выходит за рамки материала книги, но 
можно дать их краткий обзор. 
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Инструкции первых четырех категорий, помимо выполнения самих операций, 
позволяют экономить ресурсы процессора, что, в свою очередь, оптимизирует ра- 
боту программных потоков и механизма спекулятивного выполнения команд. 
Программный код при этом также значительно сокращается и упрощается. Даже 
по сравнению с быстрыми $5Е2-командами 5$Е3-команды во многих случаях 
более экономичны. 

Две команды последней группы — поп1фог и тма1& — позволяют потоку рабо- 
тающего приложения сообщать процессору, что в данный момент он не выполня- 
ет полезной работы и находится в режиме ожидания. В этом случае процессор 
может перейти в режим пониженного энергопотребления или (если используется 
гиперпотоковая технология) отдать все ресурсы другому программному потоку. 

Обобщая, можно смело утверждать, что с появлением технологии 35Е3 перед 
программистами открываются новые возможности по оптимизации кода и разра- 
ботке еще более производительных приложений. 


Базовые инструкции 
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Это приложение является справочником по базовой системе команд семейства 
процессоров пе]. В справочник включены команды для моделей процессоров 
80386 и более поздних. Для описания форматов команд используется ряд аббре- 
виатур, представленных в табл. А.1. Сами команды описаны в табл. А.2. 


Таблица А.1. Аббревиатуры команд 
Обозначение Краткое описание 


Вед Один из 8-, 16- или 32-разрядных регистров из списка: АН, АЕ, 
ВН, ВЕ, СН, СЫ, АХ, ВХ, СХ, ОХ, $1, 01, ВР, $Р, ЕАХ, ЕВХ, ЕСХ, 
ЕОХ, ЕФТ, ЕОТ, ЕВР, ЕЗР 


гед8, гед16, гед32. Регистр общего назначения, определяемый количеством битов 
Асс АС, АХ или ЕАХ 

Мет Операнд в памяти 

тет8, тет16, тет32 Операнд в памяти, определяемый количеством битов 

ттед Непосредственный операнд 


иттед8, тте416, иптед32 Непосредственный операнд с определенным количеством битов 
ГаБе! Метка 


Таблица А.2. Система команд 


Код операции Операнды Функция 

ааа АЗСП-коррекция после сложения 
аа4 АЗСП-коррекция перед делением 
аат АЗСП-коррекция после умножения 
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Таблица А.2 (продолжение) 
Код операции Операнды Функция 
аа$ АЗСП-коррекция после вычитания 
а4с гед, гед Сложение с переносом 
тет, гед 
гед, тет 
гед, ттей 
тет, птед 
асс, иттед 
ада гед, гед Сложение 
тет, гед 
гед, тет 
гед, ттей 
тет, иптед 
асс, иттеф 
апа гед, гед Логическое И 
тет, гед 
гед, тет 
гед, иттед 
тет, иттед 
асс, ттед 
БЕ, Б5г гед16, гед16 Сканирование битов 
гед16, пет16 
гед32, гед32 
гед32, тет32 
Ы, Ыс, Ыг, Ы5 гед16, ттед8 Проверка битов 
гед16, гед16 
тет16, ттед8 
тет16, гед16 
са! 1аБе! Вызов процедуры 
гед 
тет16 
тет32 
сбм Преобразование байта в слово 
сад Преобразование двойного слова в учетверенное 
(= ` Сброс флага переноса 
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Код операции Операнды Функция 
94 Сброс флага направления 
[* Сброс флага прерывания 
стс Инвертирование флага переноса 
стр Сравнение операндов 
стрз, стрзь, тет, тет Сравнение строк 
стреми, стрза 
©сма Преобразование слова в двойное слово 
Даа Десятичная коррекция после сложения 
да5 Десятичная коррекция после вычитания 
дес гед Декремент 
тет 
@\ гед Деление без знака 
тет 
м гед Деление целых чисел со знаком 
тет 
ити] гед Умножение целых чисел со знаком 
тет 
м асс, иттед Ввод из порта 
пс гед Инкремент 
тет 
пе Генерирование программного прерывания 
те Возврат из прерывания 
3ЗсопаЧоп 1аБе! Переход, если выполнено условие 
тр 1аБе! : безусловный переход 
Даве Загрузка флагов в АН 
145, 1е$, №, 14$, [6$ Загрузка дальнего указателя 
1еа гед, тет Загрузка текущего адреса 
104$, Ю4$Ь, 1095\/, тет Загрузка строки в аккумулятор 
Юаза 
юЮор 1аБе! Цикл, в котором выполняется декремент регистра СХ 
и переход на метку, пока СХ больше 0 
юоре, юорг таБе! Цикл, если равно 0. Декремент регистра СХ и переход 
на метку, если СХ больше 0 и флаг нуля установлен 
|юорпе, юорг Лаба! Цикл, если не равно 0. Декремент регистра СХ 
и переход на метку, если СХ больше 0 и флаг 
нуля сброшен 


продолжение „7 
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Таблица А.2 (продолжение) 


Код операции 
поу 


то\5, том, 
тоУ$\/, поу$4 


му 


пед 


пор 


оц 


рор 


рора, рорад 


рорЁ, рорРа 
ризй 


ризпа, ризпад 


Операнды 
гед, гед 
тет, гед 
гед, тет 
гед, ттед 
тет, иттед 


тет, тет 


гед 

тет 

гед, гед 
тет, гед 
гед, тет 
гед, нттед 
тет, ттед 
асс, иитед 
нттед, асс 
ОХ, асс 
гед16 
гед32 
тет16 
тетз32 


гед16 
гед32 
тет16 
тет32 


Функция 
Пересылка операндов 


Пересылка строк 


Умножение целых чисел без знака 


Изменение знака операнда 


Отсутствие операций; используется для организации 
задержек в циклах 


Логическое НЕ; инвертирование каждого бита 
операнда 


Логическое ИЛИ 


Вывод в порт 


Извлечение операнда из стека 


Извлечение из стека регистров общего назначения 
(рора — 16-разрядных, рора@ — 32-разрядных) 


Извлечение флагов из стека 


Помещение в стек 


Помещение в стек всех регистров 


Код операции 


ризВЁ, риз А 
га 


гСГ 


гер 


герсопайюп 
ге 
ге 


го] 


Гог 


ан 
за! 


$56 


Операнды 


гед, ттед8 
гед, СЁ 

тет, иитед8 
тет, СЁ 

гед, ттед8 
гед, СЕ 

тет, !ттед8 
тет, СЁ 


нитед8 


гед, ттед8 
гед, СЁ 

тет, иттед8 
тет, СЁ 

гед, иттед8 
гед, СЁ 

тет, нптед8 
тет, СЁ 


гед, ттед8 
гед, СЁ 

тет, !ттед8 
тет, СЁ 

гед, ттед8 
гед, СЁ 

тет, ттед8 
тет, СЁ 

гед, гед 
тег, гед 

гед, тет 

гед, иттед 
тет, иттед 
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Функция 
Помещение регистра флагов в стек 


Циклический сдвиг операнда влево через флаг 
переноса 


Циклический сдвиг операнда вправо через флаг 
переноса 


Повторение команды для строкового примитива 
с использованием регистра СХ как счетчика 


Повторение команд строковых примитивов по условию 
Возврат из процедуры 


Возврат из процедуры с восстановлением стека. 
Непосредственный операнд определяет значение, 
которое должно быть добавлено к регистру- 
указателю стека 


Циклический сдвиг влево 


Циклический сдвиг вправо 


Загрузка регистра флагов из регистра АН 
Арифметический сдвиг влево 


Арифметический сдвиг вправо 


Вычитание с заемом 


продолжение 
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Таблица А.2 (продолжение) 


Код операции 


эсаз, эса$Ь, саз\\, 
5савд 


5ЕТсопаюп 


$Н 


УНР 


$с 
$4 
$4 


560$, $1056, $05\,, 
$4054 


5иБ 


{е5 


май 


хХСНа 


Операнды 
тет 


гед8 
тет8 


гед, ттед8 
гед, СЁ 

тет, нптед8 
тет, СЁ 

гед, иттед8 
гед, СЁ 

тет, нитед8 
тет, СЁ 


тет 


гед, гед 
тет, гед 
гед, тет 
гед, иттед 
тет, иптед 
асс, иттед 
гед, гед 
тет, гед 
гед, тет 
гед, иттед 
тет, иттед 
асс, итптед 


гед, гед 
тет, гед 
гед, тет 


Функция 


Сканирование строки со сравнением значений 
элементов со значением в аккумуляторе 


Установка по условию. Если заданное условие 
истинно, то байт-получатель устанавливается 
в 1, если ложно —в0 


Логический сдвиг влево 


Логический сдвиг вправо 


Установка флага переноса 
Установка флага направления 
Установка флага прерывания 


Сохранение содержимого аккумулятора в ячейке 
памяти, принадлежащей буферу строки 


Вычитание 


Проверка отдельных битов операнда-получателя 

с соответствующими битами операнда-приемника. 
Выполняется операция логического И, в результате 
устанавливаются соответствующие флаги 


Приостановка процессора 


Обмен содержимым операнда-отправителя 
и операнда-получателя 


Код операции 
жа аф  — 


хог 


Операнды 
тет 


гед, гед 
тет, гед 
гед, тет 
гед, иптед 
тет, иптед 
асс, иитед 
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Функция 


Использование значения в регистре АЁ как индекса 
таблицы, на которую указывает содержимое 
регистра ВХ 


Логическое исключающее ИЛИ 


Специальные 
инструкции 
процессоров 80х86 





Это приложение является справочником по специальным командам семейства 
процессоров ие] Репйит. Для описания форматов команд используется ряд аб- 
бревиатур, представленных в табл. Б.1. Сами команды описаны в табл. Б.2 и Б.3. 


Таблица Б.1. Аббревиатуры команд 
Обозначение Краткое описание 


Кед Один из 8-, 16- или 32-разрядных регистров из списка: АН, А!, 
ВН, ВЕ, СН, СЕ, АХ, ВХ, СХ, ОХ, $1, ОГ, ВР, $Р, ЕАХ, ЕВХ, ЕСХ, 
ЕОХ, ЕЗГ, ЕОТ, ЕВР, ЕР 


гед8, гед16, гед32 Регистр общего назначения, определяемый количеством битов 
Асс АЕ, АХ или ЕАХ 

Мет Операнд в памяти 

тет8, тет16, тет32 Операнд в памяти, определяемый количеством битов 

1ттед Непосредственный операнд 


нитед8, 1птед16, !ттед32 Непосредственный операнд с определенным количеством битов 
ГаБе! Метка 


Таблица Б.2. Команды $её СС процессоров 1пе! Репбит 


Код операции Операнды Функция 

ЗЕТАЕ/ЕТМВ тет8/гед8 Установить, если больше или равно/не меньше 
ЗЕТЕ/ЗЕТ2 тет8/гед8 Установить, если равно/нуль 

ЗЕТМЕ/ЪЕТМ2 тегт8/гед8 Установить, если не равно/не нуль 
ЗЕТВ/ЗЕТМАЕ тет8/гед8 Установить, если меньше/не больше или равно 
ЗЕТВЕ/5ЕТМА тет8/гед8 Установить, если меньше или равно/не больше 
ЗЕТУЗЕТМСЕ тет8/гед8 Установить, если меньше/не больше или равно 


ЗЕТСЕ/ЕТМЕ тет8/гед8 Установить, если больше или равно/не меньше 





Код операции 
ЗЕТС/5ЕТМЕ 
$ЕТ$ 

$ЕТМ$ 

ЗЕТС 

$ЕТМС 

ЕТО 

ЗЕТМО 
ЗЕТР/ЗЕТРЕ 
$ЕТМР/ЗЕТРО 
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Операнды 
тет8/гед8 
тет8/гео8 
тет8/гед8 
тет8/гед8 
тет8/гед8 
тег8/гед8 
тет8/гед8 
тет8/гед8 
тет8/гед8 
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Функция 

Установить, если больше/не меньше или равно 
Установить, если флаг $Е = 1 

Установить, если флаг $Е = 0 

Установить, если флаг СЕ = 1 

Установить, если флаг СЕ = 0 

Установить, если флаг ОЕ = 1 

Установить, если флаг ОЕ = 0 

Установить, если флаг РЕ = 1 

Установить, если флаг РЕ = 0 


Таблица Б.3. Команды стоуСС процессоров Тпёе! Репйит 


Код операции 
СМОМА/СМОУМВЕ 


СМОМАЕ/СМОММВ 
Смом\С 
СМОМВ/СМОММАЕ 
СМОУС 
СМОМВЕ/СМОУМА 
СМОМЕ/СМО\? 
СМОММЕ/СМОММ2 
СМОМР/СМОМРЕ 
СМОММР/СМОМРО 
СМОМСЕ/СМОММ. 
СМОМИ/СМОММСЕ 


СМОМЪЕ/СМОУМС 


Операнды 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед 16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32. 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 
гед16/32, тет16/32 
гед16/32, гед16/32 


Функция 
Переслать, если больше/не меньше или равно 


Переслать, если больше или равно/не меньше 


Переслать, если флаг переноса СР не установлен 


Переслать, если меньше/не больше или равно 


Переслать, если флаг переноса СЕ установлен 


Переслать, если меньше или равно/не больше 


Переслать, если равно или установлен флаг 2Е 


Переслать, если не равно или не установлен флаг 2Е 


Переслать, если установлен флаг РЕ 


Переслать, если не установлен флаг РЕ 


Переслать, если больше или равно/не меньше 


Переслать, если меньше/не больше или равно 


Переслать, если меньше или равно/не больше 


продолжение „7 
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Таблица Б.З (продолжение) 
Код операции Операнды 


Смомо гед 16/32, тет16/32 
гед 16/32, гед16/32 
СМОУМО гед16/32, тет16/32 
гед16/32, гед16/32 
СМО\5 гед16/32, тет16/32 
гед16/32, гед16/32 
СМОУМ№5 гед 16/32, тет16/32 


гед16/32, гед16/32 


Функция 
Переслать, если установлен флаг ОР 


Переслать, если не установлен флаг ОЕ 


Переслать, если установлен флаг $Р 


Переслать, если не установлен флаг $Р 
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КЛУБ ПР ОНАЛ 





В 1997 году по инициативе генерального директора Издательского дома «Питер» 
Валерия Степанова и при поддержке деловых кругов города в Санкт-Петербурге 
был основан «Книжный клуб Профессионал». Он собрал под флагом клуба про- 
фессионалов своего дела, которых объединяет постоянная тяга к знаниям и любовь 
к книгам. Членами клуба являются лучшие студенты и известные практики из раз- 
ных сфер деятельности, которые хотят стать или уже стали профессионалами в той 
или иной области. 

Как и все развивающиеся проекты, с течением времени книжный клуб вырос 
ь «Клуб Профессионал». Идею клуба сегодня формируют три основные «клубные» 

ункции: 


® неформальное общение и совместный досуг интересных людей; 

® участие в подготовке специалистов высокого класса 
семинары, пакеты книг по специальной литературе}; 

® формирование и высказывание мнений современного профессионала 
(при встречах и на страницах журнала). 


КАК ВСТУПИТЬ В КЛУБ? 
Для вступления в «Клуб Профессионал» вам необходимо: 


® ознакомиться с правилами вступления в «Клуб Профессионал» 
на страницах журнала или на сайте мммм.рНег. сот; 
® выразить свое желание вступить в «Клуб Профессионал» 
по электронной почте розфоок@риег.сот или по тел. (812) 703-73-74; 
® заказать книги на сумму не менее 500 рублей в течение любого времени 
или приобрести комплект «Библиотека профессионала». 


«БИБЛИОТЕКА ПРОФЕССИОНАЛА» 


Мы предлагаем вам получить все необходимые знания, подписавшись на «Библио- 
теку профессионала». Она для тех, кто экономит не только время, но и деньги. 
Покупая комплект — книжную полку «Библиотека профессионала», вы получаете: 


® скидку 15% от розничной цены издания, без учета почтовых расходов; 
® при покупке двух или более комплектов — дополнительную скидку 3%; 
® членство в «Клубе Профессионал»; 
® подарок — журнал «Клуб Профессионал». 
пзалтЕпьский пом 


Закажите бесплатный журнал РЕ ПИ ТЕР? ь 


«Клуб Профессионал». ММУ М. РИТЕЯ.СОМ 


РЕПИТЕР” 


ходить по магазинам? 










наберите: 


мммлм.рКег.сопт 


Здесь вы найдете: 






Все книги издательства сразу 

Новые книги — в момент выхода из типографии 

Информацию о книге — ‘отзывы, рецензии, отрывки 
Старые книги — в библиотеке и на СО 





И наконец, вы нигде не купите 
наши книги дешевле! 





КНИГА-ПОЧТОЙ 


РАДИОМАТЕРИАЛЫ, РАДИОКОМПОНЕНТЫ И ЭЛЕКТРОНИКА: 


$, С. Пера 


УЧЕБНОЕ ПОСОБИЕ | „ллукьдкитиллы, 


РАДУИЖОМЕКАНЕНТЫ 
Вкниге изложены основы строения радиоматериалов и физические процессы, ОАВЕТРОНИКА 


происходящие в проводниковых, полупроводниковых, диэлектрических и 
магнитных материалах. В частности, рассмотрены контактные явления в 
радиоматериалах, лежащие в основе создания полупроводниковых приборов; 
структура, физические процессы, характеристики и параметры пассивных 
радиокомпонентов, полупроводниковых приборов и интегральных схем; 
процессы в электронных приборах вакуумной, в том числе высокочастотной, 
электроники; некоторые свойства приборов функциональной электроники. 
Рекомендовано УМО по образованию в области радиотехники, электроники, 
биомедицинской техники и автоматизации в качестве учебного пособия для 
студентов высших учебных заведений, обучающихся по направлению 654200 — 
«Радиотехника». 





512с., 17х24, перепл. 
Код 1164 


Павловская Т. А.  кеодмсикии» _ 
С/С++. ПРОГРАММИРОВАНИЕ НАЯЗЫКЕ ВЫСОКОГО УРОВНЯ: ТА Паши 


УЧЕБНИК ДЛЯ ВУЗОВ СС м 


Задача этой книги — дать краткое и четкое изложение языка С++ в соответствии 
со стандартом [ЗОЛЕС 14882. Учебник предназначен в первую очередь для” И 
студентов, изучающих язык «с нуля», нои более искушенные в программировании + 
специалисты найдут в нем немало полезной информации. В книге 
рассматриваются принципы объектно-ориентированного программирования и 
их реализация на С++, средства, возможности и конструкции языка, приводятся 
практические примеры, дается толчок к дальнейшему изучению этого и других 
языков программирования. 

Контрольные задания по ключевым темам представлены в 20 вариантах, иавтор 
надеется, что праподаватели достойно оценят проявленную о них заботу. 








464 с., 17х24, обл. 
Код 2112 


Павловская Т. А. 

С/С++. СТРУКТУРНОЕ ПРОГРАММИРОВАНИЕ. ПРАКТИКУМ ^^ и... ‹. 
Практикум предназначен для изучения языка С++ на семинарах и для его . С С ++ 
самостоятельного освоения. Он является дополнением кучебникуТ. А. Павловской . 
«С/С++. Программирование на языке высокого уровня», выпущенному _ 
издательством «Питер» в 2001 году. 
В практикуме на примерах рассматриваются средства С++, используемые :. - 
в рамках структурной парадигмы: стандартные типы данных, основные ; . 
конструкции, массивы, строки, структуры, функции, шаблоны, динамические => 
структуры данных. Обсуждаются алгоритмы, приемы отладки, вопросы качества 8 . 
и стиля. По каждой теме приведено несколько комплектов из 20 вариантов 
заданий. 240 с., 17х24, обл. 


РАПИТЕР“ вы 
ся 





Зорукзурике прарьимировиние 
Практекум 








КНИГА-ПОЧТОЙ 


ЗАКАЗАТЬ КНИГИ ИЗДАТЕЛЬСКОГО ДОМА «ПИТЕР» 
МОЖНО ЛЮБЫМ УДОБНЫМ ДЛЯ ВАС СПОСОБОМ: 


по телефону: (812) 703-73-74; 

по электронному адресу: розФоок@риег.сот; 
на нашем сервере: мммм.рНег. сот; 

по почте: 197198, Санкт-Петербург, а/я 619, 
ЗАО «Питер Пост». 





ВЫ МОЖЕТЕ ВЫБРАТЬ ОДИН ИЗ ДВУХ СПОСОБОВ ДОСТАВКИ 
И ОПЛАТЫ ИЗДАНИЙ: 


«= Наложенным платежом с оплатой заказа при получении посылки на 
ближайшем почтовом отделении. Цены на издания приведены ориентиро- 
вочно и включают в себя стоимость пересылки по почте (но без учета 
авиатарифа). Книги будут высланы нашей службой «Книга-почтой» 

_ втечение двух недель после получения заказа или выхода книги из печати. 

<= Оплата наличными при курьерской доставке (для жителей Москвы 
и Санкт-Петербурга). Курьер доставит заказ по указанному адресу 
в удобное для вас время в течение трех дней. 


ПРИ ОФОРМЛЕНИИ ЗАКАЗА УКАЖИТЕ: 


® фамилию, имя, отчество, телефон, факс, е-пай; 

® почтовый индекс, регион, район, населенный пункт, 
улицу, дом, корпус, квартиру, 

® название книги, автора, код, количество заказываемых 
экземпляров. 


.. изаатЕаьский вом 
Вы можете заказать бесплатный в 


журнал «Клуб Профосомовал ЕПТИТЕЕ 


изалтЕльский аом 


РЕПИТЕР® — кикнтовинык 


ия иг. РИТЕВ. СОМ 


ПРЕДСТАВИТЕЛЬСТВА ИЗДАТЕЛЬСКОГО ДОМА «ПИТЕР» 
предлагают эксклюзивный ассортимент компьютерной, медицинской, 
психологической, экономической и популярной литературы 


РОССИЯ 
Москва м. «Павелецкая», 1-й Кожевнический переулок, д.10; тел./факс (495) 234-38-15, 
255-70-67, 255-70-68; е-тай: заез@риег.т$К.ги 
Санкт-Петербург м. «Выборгская», Б. Сампсониевский пр., д. 29а; 
тел./факс (812) 703-73-73, 703-73-72; е-тай: заез@риег.сот 


Воронеж Ленинский пр., д. 169; тел./факс (4732) 39-43-62, 39-61-70; 
е-тай: риегити@сотся м 
Еквтеринбург ул. 8 Марта, д. 2676, офис 202; 
тел./факс (343) 225-39-94, 225-40-20; е-тай: рйег-игаКоУпе{.ги 
Нижний Новгород ул. Совхозная, д. 13; тел. (8312) 41-27-31; 
е-тай: ойсе@ппом.рйег.сот 
Новосибирск ул. Немировича-Данченко, д. 104, офис 502; 
тел./факс (383) 211-93-18, 211-27-18, 314-23-89; е-тай: ойсе@лпзк.риег.сот 
Ростов-на-Дону ул. Ульяновская, д. 26; тел. (8632) 69-91-22, 69-91-30; 
е-тай: Фтесог@тгозюу.ркег.сот 
Самара ул. Молодогвардейская, д. 33, литер Ад, офис 225; тел. (846) 277-89-79; 

е-тай:; римова@залие!.ги 


УКРАИНА 
Харьков ул. Суздальские ряды, д. 12, офис 10-11; тел./факс (1038057) 712-27-05, 751-10-02; 
е-тай: риег@Кнаком.рйег.сот 
Киев пр. Московский, д. 6, кор. 1, офис 33; тел./факс (1038044) 490-35-68, 490-35-69; 
е-тай: оНсе@Юеу.ркег.сот 


БЕЛАРУСЬ 
Минск ул. Бобруйская, д. 21, офис 3; тел./факс (1037517) 226-19-53; 
е-тай: ойсе@титзк.риег. сот 


> Ищем зарубежных партнеров или посредников, имеющих выход на зарубежный рынок. 
* Телефон для связи: (812) 703-73-73. 
Е-та!: опдопап@риег.сот 


р Издательский дом «Питер» приглашает к сотрудничеству авторов. 
Обращайтесь по телефонам: Санкт-Петербург — (812) 703-73-72, 
Москва — (495) 974-34-50. 


\ 


р; Заказ книг для вузов и библиотек: (812} 703-73-73. 
Специальное предложение - е-тай: Ко2т@риег.сот 


\ 


ИЗДАТЕПЬСКИЙ аОМ 


Р=ЕПИТЕР” 


ММ. РТЕЯ. СОМ 


Башкортостан 

Уфа, «Азия», ул. Гоголя, д. 36, офис 5, 
тел./факс (3472) 50-39-00, 51-85-44. 
Е-плай: азаа@Шапе(.ги 


Дальний Восток 

Владивосток, «Приморский торговый дом книги», 
тел./факс (4232) 23-82-12. 

Е-хпай: Боокразе@тай.ритогуе.ги 


Хабаровск, «Мирс», 
тел. (4212) 30-54-47, факс 22-73-30. 
Е-тай: зае_Боок@рооктиз.КИм.ги 


Хабаровск, «Книжный мир», 
тел. (4212) 32-85-51, факс 32-82-50. 
Е-пай: розтазег@\мо|ЧЬооК$. КИ. ги 


Европейские регионы России 
Архангельск, «Дом книги», 

тел. (8182) 65-41-34, факс 65-41-34. 
Е-плай: Боок@апеги 


Калининград, «Вестер», 

тел./факс (0112) 21-56-28, 21-62-07. 
Е-гпай: пзпкома@ме $ ег.ги 

Вр: /Лимлм мезег.ги 


Северный Кавказ 

Ессентуки, «Россы», ул. Октябрьская, 424, 
тел./факс (87934) 6-93-09. 

Е-ппай: гоззу@Ктлм.ги 


Сибирь 

Иркутск, «ПродаЛитЪ», 

тел. (3952) 59-13-70, факс 51-30-70. 
Е-глай: рода @ИК.ги 

ВЕр:/Лиммм. ргода.ИК.ги 


Иркутск, «Антей-книга», 
тел./факс (3952) 33-42-47. 
Е-глай: ащеу<иК.ги 


УВАЖАЕМЫЕ ГОСПОДА! 

КНИГИ ИЗДАТЕЛЬСКОГО ДОМА «ПИТЕР» 
ВЫ МОЖЕТЕ ПРИОБРЕСТИ 
ОПТОМ И В РОЗНИЦУ 
У НАШИХ РЕГИОНАЛЬНЫХ ПАРТНЕРОВ. 


Красноярск, «Книжный мир», 
тел./факс (3912) 27-39-71. 
Е-гай: Боок-мопа@ри с .Кгазпее.ги 


Нижневартовск, «Дом книги», 
тел. (3466) 23-27-14, факс 23-59-50. 
Е-тай: Боок@ипмайомзК мзпей.ги 


Новосибирск, «Топ-Книга», 

тел. (3832) 36-10-26, факс 36-10-27. 
Е-тай: оНсе@\юр-Кпда.ги 
ВИр:/Лмилу Дор-Кпда.ги 


Тюмень, «Друг», 
тел./факс (3452) 21-34-82. 
Е-тай: гид @Муитеп.ги 


Тюмень, «Фолиант», 
тел. (3452) 27-36-06, факс 27-36-11. 
Е-тай: пап @\уитеп.ги 


Челябинск, ТД «Эврика», ул. Барбюса, д. 61, 
тел./факс (3512) 52-49-23. 
Е-тпай:емКа@сие!.зитпе{.ги 


Татарстан 

Казань, «Таис», 

тел. (8432) 72-34-55, факс 72-27-82. 
Е-тай: \а5 @Бапсогр.ги 


Урал 

Екатеринбург, магазин № 14, 
ул. Челюскинцев, д. 23, 
тел./факс (3432) 53-24-90. 
Е-тай: дуагФа@утай.иг.ги 


Екатеринбург, «Валео-книга», 
ул. Ключевская, д. 5, 
тел./факс (3432) 42-56-00. 
Е-тай: уаео@ее|.ги 


Я Ин у 






Значение языка ассемблера трудно переоценить. Все без исключения средства разработки 
программ в той или иной степени используют ассемблер. К примеру, большинство 
библиотечных функций, входящих в \//зиа| С++ и бер! и составляющих их основу, написаны 

на ассемблере. Мультимедийные приложения, программы обработки сигналов и многие другие 
используют высокопроизводительные библиотеки функций, разработанные с помощью 
ассемблерных команд технологии $1МО. Большинство приложений, работающих в режиме 
реального времени, либо написаны целиком на ассемблере, либо используют в критических 
участках кода ассемблерный код. Изучение современного ассемблера — задача далеко 

не простая, и зта книга, расширенное руководство по применению ассемблера процессоров 
1те! Репбит, позволит читателю успешно ее решить. Для опытных программистов 

она будет полезна в качестве справочного пособия, так как содержит много справочной 
информации по командам ассемблера и современным технологиям обработки данных. 

Не являясь учебником, она может использоваться и в зтом качестве теми, кто хотел бы изучить 


ассемблер самостоятельно. 


Тема: Программирование/Аззет Бег Уровень читателя: начинающий/опытный 


РЕПИТЕР" Т5ВМ 5-469-00662-Х 


197198, Санкт-Петербург, а/я 619 
тел.: (812) 703-73-74, ро$фБоок@риег.сот 
9178 


61093, Харьков-93, а/я 9130 
тел.: (057) 712-27-05, риег@КНагКом.рйег.сот 


мумгиг.рег.сот — вся информация о книгах и веб-магазин 


54691006626 


